AAAISep, 2021
文本到图像检索的跨模态一致性
Cross-Modal Coherence for Text-to-Image Retrieval
Malihe Alikhani, Fangda Han, Hareesh Ravi, Mubbasir Kapadia, Vladimir Pavlovic...
TL;DR本文提出了一种跨模态相依的一致性模型,用于提高现有联合理解模型的性能,结果展示出使用相依性理念的模型能够更好地检索与目标文本相关的图像,这对不同模态间的沟通及在捕获文本与图像常识推理中相依性关系的角色具有重要的研究意义。