CVPRJun, 2021
增强 2D-TAN: 一种用于人类中心的时空视频定位的两阶段方法
Augmented 2D-TAN: A Two-stage Approach for Human-centric Spatio-Temporal Video Grounding
Chaolei Tan, Zihang Lin, Jian-Fang Hu, Xiang Li, Wei-Shi Zheng
TL;DR本研究提出了一种有效的两阶段方法,利用增强的 2D-TAN 对文本描述进行时间上的定位,同时使用 MDETR 模型生成每帧包围盒并设计了一组手工规则,筛选出与定位短语最匹配的包围盒。