CVPRDec, 2020

多镜头时间事件定位:基准测试

TL;DR本文提出了一个新的挑战性任务,即多镜头时间事件定位,并相应地收集了一个名为 MUSES 的大规模数据集,其中包含 31,477 个事件实例,共计 716 个小时的视频;同时,我们在处理内部实例差异方面提出了一个简单的基线方法,并在 IoU=0.5 的情况下,在 MUSES 和 THUMOS14 上报告了分别为 18.9%和 56.9%的 mAP 值。