Dec, 2023

RGNet:一个用于长视频的统一检索与定位网络

TL;DR通过统一跨模态 RG-Encoder 和稀疏采样技术,RGNet 方法实现了对长视频进行端到端的特定时刻定位,从而超过了以往在长视频时间定位数据集 MAD 和 Ego4D 上的方法,展示了最先进的性能。