Apr, 2024

HaVTR:利用大型基础模型改进视频 - 文本检索的方法

TL;DRHaVTR 提出了一种新颖的视频 - 文本学习范式,通过数据增强和引入生成模型生成更加丰富的数据,提高视频 - 文本检索模型的表示学习能力,在多个检索基准测试中展现了优越性。