Jan, 2024

上下文引导的时空视频定位

TL;DR提出了一种上下文引导的时空视频定位方法(CG-STVG),通过挖掘视频中的实例上下文信息作为目标定位的辅助指导,并通过消除不相关或有害信息来改进实例上下文,从而提高目标的准确性。在三个基准测试上,包括 HCSTVG-v1/-v2 和 VidSTG,CG-STVG 在 m_tIoU 和 m_vIoU 上都取得了新的最优结果,显示了其有效性。