Aug, 2020

VLANet: 弱监督视频时刻检索的视频-语言对齐网络

TL;DR本文提出了一种弱监督方法(wVMR)进行视频瞬间检索,通过使用对齐网络实现了更清晰的注意力和更少的计算负荷,并使用对比学习来训练模型。