CVPRMar, 2024

文本是 MASS: 用于文本 - 视频检索的随机嵌入建模

TL;DR该研究提出了一种新的文本建模方法 T-MASS,通过将文本建模为随机嵌入,丰富了文本嵌入的语义范围,并在准确检索时利用了文本质量,从而在五个基准数据集上取得了最先进的性能。