MMSep, 2022

学会先观察:通过学习一致的跨模态共同流形来改善基于文本的人员检索

TL;DR以 LBUL 算法为例,该文研究如何解决文本 - 图像跨模态数据不一致的问题,通过考虑视觉和文本模态的分布特征,实现更加可靠的跨模态分布一致性,从而实现更优秀的文本 - 图像跨模态检索准确率。