CVPRJul, 2021

CMT: 卷积神经网络与视觉 Transformer 相遇

TL;DR本文提出了一种基于 Transformer 和 CNN 的新型混合神经网络(CMTs),通过捕捉图像中的长程依赖和建模本地特征,实现了比现有的 DeiT 和 EfficientNet 更高的精度和更小的计算成本。