Nov, 2020

SEA: 用文本查询进行视频检索的句子编码器组合

TL;DR本研究提出了一种名为 Sentence Encoder Assembly 的新方法,通过多空间多损失学习实现语句编码器的有效利用和文本-视频匹配,并在四个基准测试中表现出优于当前最先进技术的性能。