May, 2023

Vision Transformers 及其基于 CNN-Transformer 的变体调查

TL;DR本文对达到卓越视觉任务表现的一类混合视觉转换器体系结构进行了分类和阐述,其中融合了卷积和自注意力机制,重点讨论了注意力机制、位置嵌入、多尺度处理和卷积等关键特征。