Aug, 2021

TVT:基于视觉 Transformer 的无监督域自适应模型

TL;DR本研究提出了一种名为 “可传递视觉 Transformer” 的统一框架,其中融合了迁移学习、注意力机制和聚类方法,以实现基于标签源域的无标签目标域的知识迁移。 实验证明,本文所提出的 TVT 方法优于现有的微调和迁移学习方法,通过注入可学习的传递性适应模块来强制 ViT 集中注意力在可转移和辨别性特征上,并借助判别性聚类来增强特征多样性和分离度。