Jan, 2022

TriCoLo: 用于精细文本形状检索的三模态对比损失

TL;DR本文采用大批量对比学习的方法,提高不同模态数据的联合嵌入效果,实现超越先前文献的文本形状检索;同时,提出了三模态学习方案以更好地表示所有模态。