Apr, 2018

Charades-Ego:大规模第三人称及第一人称配对视频数据集

TL;DR本文介绍了 Charades-Ego Dataset,它是一个大规模的第一人称和第三人称视频数据集,包含 68.8 小时、68536 个活动实例,并且具有时间注释和文本描述,适用于第一人称视角下的视频分类、定位、字幕等任务,以及跨模态数据的新任务。