CVPRMar, 2023

基于半监督领域适应的 Patch-Mix Transformer 模型:从游戏角度出发

TL;DR本文提出了一种名为 PMTrans 的模型,从博弈论的角度解决了视觉转换器在挑战性无监督领域自适应(UDA)任务中的问题,通过提出一种基于 ViT 的模块 ——PatchMix 的方法来有效地建立中间域,并利用特征和标签空间中的两个半监督 mixup 损失将它们最小化,以此将源域和目标域相连,以实现最大化交叉熵。通过这样做,我们将 UDA 的过程解释为由特征提取器、分类器和 PatchMix 组成的三方最小 - 最大交叉熵游戏,以找到纳什均衡,并利用 ViT 的注意力图重新加权每个补丁的标签,以获得更多的域辨别特征表示。经过对四个基准数据集的广泛实验,结果表明,PMTrans 在 Office-Home 上超过了 ViT 和 CNN 等最先进的方法 3.6%,在 Office-31 上超过了 1.4%,在 DomainNet 上超过了 17.7%。