Dec, 2023
RGNet:一个用于长视频的统一检索与定位网络
RGNet: A Unified Retrieval and Grounding Network for Long Videos
Tanveer Hannan, Md Mohaiminul Islam, Thomas Seidl, Gedas Bertasius
TL;DR通过统一跨模态 RG-Encoder 和稀疏采样技术,RGNet 方法实现了对长视频进行端到端的特定时刻定位,从而超过了以往在长视频时间定位数据集 MAD 和 Ego4D 上的方法,展示了最先进的性能。