CVPRJan, 2022

利用多项选择题桥接视频文本检索

TL;DR该研究提出了一种新的预训练方法,利用多项选择问题建立视频和文本之间的语义联系以实现更高效的检索,其结果在不同实验设置下如零成本和微调等多种数据集上均优于现有方法。