BriefGPT.xyz
Mar, 2021
跨模态视频文字检索的记忆增强嵌入学习
Memory Enhanced Embedding Learning for Cross-Modal Video-Text Retrieval
HTML
PDF
Rui Zhao, Kecheng Zheng, Zheng-Jun Zha, Hongtao Xie, Jiebo Luo
TL;DR
本研究提出了一种新颖的记忆增强嵌入学习(MEEL)方法,构建了两种记忆模块,交叉模态记忆模块和文本中心记忆模块,用于跨模态视频文本检索任务,解决了局部负样本和文本描述多样性的问题。在MSR-VTT和VATEX两个基准数据集上进行的实验表明,该方法具有很高的有效性。
Abstract
cross-modal
video-text retrieval
, a challenging task in the field of vision and language, aims at retrieving corresponding instance giving sample from either modality. Existing approaches for this task all focus
→