CVPRNov, 2021
自注意力和卷积的融合
On the Integration of Self-Attention and Convolution
Xuran Pan, Chunjiang Ge, Rui Lu, Shiji Song, Guanfu Chen...
TL;DR本文指出卷积和自注意力之间存在强烈的联系,两个模型的第一阶段都包含了相似的运算,本文提出了 ACmix 模型将它们混合使用从而最小化计算成本,实验结果表明,该模型在图像识别和 Downstream 任务上均取得了显著的改进。