BriefGPT.xyz
Oct, 2022
面向模态的视频语料库时刻检索的伪查询生成
Modal-specific Pseudo Query Generation for Video Corpus Moment Retrieval
HTML
PDF
Minjoon Jung, Seongho Choi, Joochan Kim, Jin-Hwa Kim, Byoung-Tak Zhang
TL;DR
本文提出了一种基于自监督学习的框架,通过生成基于视觉和文本信息的伪查询,利用多模式信息来定位视频片段,有效地解决了视频中存在的时序动态和多模式推理问题,并在实验中取得了竞争性的结果。
Abstract
video corpus moment retrieval
(VCMR) is the task to retrieve the most relevant video moment from a large video corpus using a natural language query. For narrative videos, e.g., dramas or movies, the holistic understanding of
→