ACLSep, 2021

EVOQUER: 通过视频相关的反向查询生成增强时间定位

TL;DR本文提出了一种时间定位框架 EVOQUER,它结合了文本视频定位模型和视频辅助查询生成网络,从而实现了查询 - 视频结合的闭环学习,并在两种流行数据集上进行实验,显示出较好的性能提升和错误分析方法。