Oct, 2023

基于聚类的图像 - 文本图匹配模型桥接领域差距

TL;DR通过融合图像和文本的多模态图形表示,我们通过考虑图像和文本描述符之间内在的语义结构得到领域不变的关键嵌入,从而实现领域泛化问题中的域不变特征学习。我们的模型在 CUB-DG 和 DomainBed 等大规模公共数据集上实验,取得了与或更好于这些数据集上的最新性能。