Mar, 2024

对抗性屏蔽视频一致性用于无监督领域适应

TL;DR我们提出了一种基于 Transformer 的模型来学习类别识别和领域不变特征表示,通过两个创新设计:首先,基于生成对抗网络对齐领域,同时学习生成具有挑战性的蒙版和对抗性编码器以最小化源域和目标域之间的距离;其次,采用蒙版一致性学习模块来学习类别识别表示,在 Epic-Kitchen 和提出的 U-Ego4D 基准上取得了最先进的性能。