Mar, 2021

将卷积结构融入视觉Transformer

TL;DR本论文提出了一种结合卷积神经网络和Transformer的新型算法Convolution-enhanced image Transformer (CeiT),在ImageNet和七个下游任务中实现了与先前Transformer和目前最先进的卷积神经网络相当的效果,而无需大量训练数据和额外的卷积神经网络教师,同时具有更好的收敛性和更低的训练成本。