Aug, 2018

AVA-Speech: 一部电影中密集标注的语音活动数据集

TL;DR本文描述了一个新的数据集,其中含有 YouTube 视频中密集标记的语音活动,目的是为该任务创建一个共享,可用的数据集,并在 AVASpeech 上使用现成的最先进的音频和视觉模型报告基准性能数字,以便于未来的研究。