MMSep, 2022
学会先观察:通过学习一致的跨模态共同流形来改善基于文本的人员检索
Look Before You Leap: Improving Text-based Person Retrieval by Learning A Consistent Cross-modal Common Manifold
Zijie Wang, Aichun Zhu, Jingyi Xue, Xili Wan, Chao Liu...
TL;DR以 LBUL 算法为例,该文研究如何解决文本 - 图像跨模态数据不一致的问题,通过考虑视觉和文本模态的分布特征,实现更加可靠的跨模态分布一致性,从而实现更优秀的文本 - 图像跨模态检索准确率。