Jun, 2022

自我中心视频-语言预训练

TL;DR本文提出了一种新的视频语言预训练(Video-Language Pretraining)方法——Egocentric VLP,通过利用新发布的Ego4D数据集,分别从EgoClip,EgoNCE和EgoMCQ三个方向进行探索,最终成功在五个自我中心任务上实现了强大的表现。