May, 2021

超越自注意力:用两个线性层的外部注意力处理视觉任务

TL;DR本文提出了外部注意力机制,它在现有流行的架构中方便地替换自我注意力,具有线性复杂度,隐含地考虑所有数据样本之间的关联,结合多头机制提供了外部注意力 MLP(EAMLP)体系结构,用于图像分类和其他任务中可提供与或优于自我注意力机制及其变体相当的结果,且计算和内存成本较低。