Apr, 2020

面向自然语言视频定位的基于Span的本地化网络

TL;DR本文提出了基于跨度问答的视频段定位网络(VSLNet)作为自然语言视频定位(NLVL)任务的解决方案,并通过有效的查询引导突出显示策略解决了NLVL与跨度问答之间的差异。在三个基准数据集上的实验表明,该方法优于现有的最优方法,采用笔画问答框架是解决NLVL的一个有前途的方向。