Apr, 2024

通过生成式标题和多词概念库改进用于即席视频搜索的可解释嵌入

TL;DR通过构建新数据集和发展多词概念库,本文解决了现有方法在出现未见查询和词汇量问题上的瓶颈,实验结果显示以上所述元素的整合将 AVS 方法在 MSRVTT 数据集上的 R@1 性能翻倍,并将在 2016-2023 年(八年)TRECVid AVS 查询集的 xinfAP 增加了 2% 到 77%,平均约为 20%。