May, 2023

连接多模态对比表示

TL;DR本文提出了一种用于跨多个模态学习的训练有效方法 C-MCR,无需成对训练数据,通过在重叠的模态 B 上对现有的 MCR 进行连接和对齐,实现了跨模态匹配,进一步引入语义增强技术以提高准确性。将该方法应用于视听对比性学习,不仅无需使用成对数据,还可以在多个数据集上获得最先进的性能表现。