CVPRApr, 2023

基于 CLIP 的开放集视频领域自适应框架 AutoLabel

TL;DR本研究提出了一种基于预训练语言和视觉模型的 open-set 无监督视频域自适应方法,并引入了 AutoLabel 来发现和生成目标专有类别的类名,通过改进的 CLIP 模型可以有效地对目标专有的类别进行识别,并提高两个域之间分享类别的对齐。