Jun, 2023

轻量化双向交互视觉变换器

TL;DR本文提出了一种全自适应自注意力机制用于视觉Transformer,以在上下文感知方面建模局部和全局信息以及其二者之间的双向交互,并介绍了一种细粒度下采样策略以增强全局感知能力,最终研发了一系列轻量级视觉骨干,Fully Adaptive Transformer (FAT) 系列,并在多个视觉任务上进行了广泛的实验,取得了优秀的性能。