Loading...
1、如果有的模型在字典里,需要提前用nn.ModuleDict(other_model_dict)进行包...
1、参考MixFormer的vis-attn即可。使用hook钩子出attn矩阵(一般是dropout层...