Loading...
1、参考MixFormer的vis-attn即可。使用hook钩子出attn矩阵(一般是dropout层...
Visualizer是一个辅助深度学习模型中Attention模块可视化的小工具,主要功能是帮助取出嵌套...