ECCVNov, 2022

InternVideo-Ego4D: Ego4D 挑战的优胜解决方案包

TL;DR本文使用 InternVideo 模型在 Ego4D 的 5 个任务中取得了优异的表现,包括 Moment Queries、Natural Language Queries、预测未来的手部动作、目标检测和短期目标交互预测。该模型适用于下游的自我中心视频理解任务,性能显著优于基线方法和 CVPR2022 的冠军,表现出其强大的表示能力。