Jan, 2024
上下文引导的时空视频定位
Context-Guided Spatio-Temporal Video Grounding
Xin Gu, Heng Fan, Yan Huang, Tiejian Luo, Libo Zhang
TL;DR提出了一种上下文引导的时空视频定位方法(CG-STVG),通过挖掘视频中的实例上下文信息作为目标定位的辅助指导,并通过消除不相关或有害信息来改进实例上下文,从而提高目标的准确性。在三个基准测试上,包括 HCSTVG-v1/-v2 和 VidSTG,CG-STVG 在 m_tIoU 和 m_vIoU 上都取得了新的最优结果,显示了其有效性。