Feb, 2021

基于跨度问答框架的自然语言视频定位再探讨

TL;DR本文提出基于 VSLNet 的自然语言视频定位 (NLVL) 方法,利用基于 span 的 question answering (QA) 框架来解决长视频定位中的性能衰退问题,并通过 VSLNet-L 模型进一步提高性能。实验结果表明,该方法优于现有方法,VSLNet-L 可以解决长时间视频性能衰退的问题。