Jun, 2021

跨模态离散表示学习

TL;DR本文提出了一种自监督学习框架,借助向量量化创建的离散嵌入空间,实现了跨不同视图(模态)之间的表征学习和匹配,从而提升了模态检索任务的性能。实验表明,所提出的多模态精细离散化表征能够为高层次摘要表征提供补充,有效改善了跨模态检索的表现。