Sep, 2019

通过上下文边界感知预测,在视频中确定语言查询的时间基点

TL;DR本文提出了一种基于Contextual Boundary-aware Prediction (CBP)的端到端模型来在视频中定位语句,并通过明确建模当前元素与其邻居之间的关系来聚合上下文信息,最终在三个公共数据集上表现显著优于现有的方法。