MMSep, 2023

双模态注意力增强的文本 - 视频检索与三元局部对比学习

TL;DR通过改进对比学习方法,引入新的技术,分别利用文本和视觉线索,从中挖掘出困难负样例,并且能够自适应地确定它们对训练损失的影响;同时,通过构建部分有序三元组样本来模拟细粒度语义相似性,以提高文本 - 视频检索的性能。