ACLOct, 2022

用 FIRE 对抗火灾:评估文本到视频检索基准的有效性

TL;DR通过修正误标的负样本,我们评测了三种模型在两个标准测试集上的表现,发现在最佳模型上,修正后的指标提升了 25% 以上。此外我们发现测试集的 recall@10 已经接近饱和,同时我们推荐以样本抽样方式缓解标注数据成本,对未来的 text-to-video retrieval 基准测试提出了建议。