Sep, 2022

CONE:一种针对长视频时间对齐的高效粗到细对齐框架

TL;DR本文提出了一种名为 CONE 的窗口层级的粗细粒度多模态对齐框架,该框架通过使用对比学习进行识别候选窗口和排名候选时刻,从而提高视频时序定位的精确度和效率,在两个大规模视频时序定位基准测试中均取得了业界最佳成果。