关键词video corpus moment retrieval
搜索结果 - 6
- 提升视频语料库时刻检索的部分相关性增强
视频语料库时刻检索~(VCMR) 是一项新的视频检索任务,旨在使用自然语言文本作为查询从大量未修剪的视频语料库中检索相关时刻。我们提出了一种提高 VCMR 的部分相关性增强模型~(PREM),该模型通过专门的部分相关性增强策略,在视频检索和 - 事件感知视频语料库时刻检索
基于 EventFormer 的视频语义检索模型,在 Video Corpus Moment Retrieval(VCMR)任务中实现了最新的成果。
- EMNLP面向模态的视频语料库时刻检索的伪查询生成
本文提出了一种基于自监督学习的框架,通过生成基于视觉和文本信息的伪查询,利用多模式信息来定位视频片段,有效地解决了视频中存在的时序动态和多模式推理问题,并在实验中取得了竞争性的结果。
- MM部分相关性视频检索
本文提出了一种名为部分相关视频检索的新的文本到视频检索子任务,并将其作为多实例学习问题来解决。作者构建了一个多尺度相似性学习网络,以同时学习剪辑尺度和帧尺度下的相似性,并在三个数据集上进行了全面的实验来证明该方法的可行性,还表明该方法可以用 - CONQUER: 视频语料库时刻检索的上下文查询感知排序
本文提出一种名为 CONQUER 的模型,通过融合多模态视频内容、进行双向注意力以及完全利用查询上下文等方式实现视频检索任务的精确定位和排序。通过实验发现,将视频和查询在线上联合表示可以更好地捕捉多模态信号来提升检索效果。
- SIGIR对比学习视频语料库瞬间检索
本文提出了一个可用于视频语料库时刻检索的检索和定位网络,采用对比学习优化视频编码器和文本编码器,从而实现视频轮廓时序信息检索。该方法效率高且具有可比性。