Feb, 2024

提升视频语料库时刻检索的部分相关性增强

TL;DR视频语料库时刻检索~(VCMR) 是一项新的视频检索任务,旨在使用自然语言文本作为查询从大量未修剪的视频语料库中检索相关时刻。我们提出了一种提高 VCMR 的部分相关性增强模型~(PREM),该模型通过专门的部分相关性增强策略,在视频检索和时刻定位两个子任务中取得了更好的性能。实验结果表明,该模型优于基准模型,在 VCMR 任务中达到了最新的性能水平。