EMNLPSep, 2021

可学习时刻提议的自然语言视频本地化

TL;DR本文介绍了一种新的模型 ——LPNet,采用学习性提议网络实现了自然语言视频定位 (NLVL) 任务,较提出与排序模型达到更好的性能。