Jan, 2025
观看视频,捕捉关键词:面向上下文的关键词注意力用于时刻检索和高亮检测
Watch Video, Catch Keyword: Context-aware Keyword Attention for Moment
Retrieval and Highlight Detection
TL;DR本研究解决了视频时刻检索和高亮检测中未能充分捕捉整体视频上下文的问题。提出了一种新颖的视频上下文关键词注意力模块,通过视频上下文聚类模块改善关键词的动态理解,从而提升与视觉和文本特征之间的细粒度对齐。实验结果表明,该方法在时刻检索和高亮检测方面显著优于现有方法。