CVPRJul, 2022

EPIC-KITCHENS-100 多实例检索挑战赛 2022 年,自我中心视频语言预训练

TL;DR本文提出了基于视频 - 语言预训练的解决方案,利用最近发布的 Ego4D 数据集,从预训练数据集、预训练目标和开发集的角度开创了自我中心的视频 - 语言预训练学习,从而获得了优秀的性能表现。