Nov, 2020

QuerYD:一个具有高质量文本和音频叙述的视频数据集

TL;DRQuerYD 是一个用于视频检索和事件定位的大规模数据集,其独特之处在于每个视频都提供了两个音轨:原始音频和视觉内容高质量的口述描述,该数据集基于 YouDescribe 项目,其音频和文本注释都是高度详细和与时间对齐的。该数据集可以用于训练和评估视频理解的模型,并公开了数据、代码和模型。