CVPRJun, 2021

增强 2D-TAN: 一种用于人类中心的时空视频定位的两阶段方法

TL;DR本研究提出了一种有效的两阶段方法,利用增强的 2D-TAN 对文本描述进行时间上的定位,同时使用 MDETR 模型生成每帧包围盒并设计了一组手工规则,筛选出与定位短语最匹配的包围盒。