ECCVNov, 2022

Ego4D 自然语言查询挑战 2022 中的高效粗 - 细对齐框架

TL;DR本技术报告介绍了 ECCV 2022 中 Ego4D 自然语言查询(NLQ)挑战的 CONE 方法。该方法利用了 COarse-to-fiNE 对齐框架,通过对比学习学习了粗粒度语义方差,同时利用对比视觉 - 文本预训练模型 EgoVLP 的强大多模态对齐能力,突出关键时刻,最终在盲测试集上取得了 R1@IoU=0.3 和 R1@IoU=0.5 的分别为 15.26 和 9.24 的结果。