Aug, 2024

T2VIndexer:一种高效文本-视频检索的生成视频索引器

TL;DR 本研究解决了现有文本-视频检索方法中由于候选视频数量增加而导致的显著时间成本问题。提出的T2VIndexer模型通过生成视频标识符,以常数时间复杂度直接检索候选视频,从而提升检索效率,并在多个标准数据集上实现了优于现有最先进模型的检索性能。