Jul, 2021

CrowdSpeech 和 VoxDIY: 众包音频转写基准数据集

TL;DR通过众包方式,我们收集并发布了大规模的 CrowdSpeech 数据集,用于推动语音识别方面的数据聚合算法的研究和发展。为此,我们设计了一套构建众包语音转录数据集的有效流程,并将其应用于缺乏资源的俄语语言建立了 VoxDIY 数据集。