CVPRMar, 2023

面向广义零样本学习的渐进语义视觉互适应

TL;DR本文提出了双重语义视觉变换器模块 (DSVTM) 来逐步建立属性原型和视觉特征之间的对应关系,构成了一种逐步的语义 - 视觉相互适应 (PSVMA) 网络,以实现语义消歧和知识可转移性的提高。DSVTM 设计了一种实例驱动的语义编码器,可以学习到面向不同图像的实例中心原型,在匹配语义 - 视觉对时可以重新配对为匹配的对。随后,语义驱动的实例解码器加强了匹配对之间精确的跨域交互,以推动无歧义视觉表示的生成。此外,为了缓解 GZSL 中对已知类的偏见,提出了减轻偏见的损失以追求已知和未知的预测一致性。PSVMA 表现出对其他最先进的方法具有卓越的性能。