Jun, 2024

使用去焦注意力网络学习一维因果视觉表示

TL;DR通过使用可学习的带通滤波器创建多样化的注意模式以及引入大规模且有计划的 drop path 率和全局池化特征的辅助损失来解决现有 1D 因果视觉模型中的“过度聚焦”问题,从而提高模型对多模态任务的性能。