Oct, 2015

MUSAN: 音乐、语音和噪声语料库

TL;DR该报告介绍了用于训练声音活动检测(VAD)和音乐 / 语音区分模型的新语料库,该语料库包括来自几种音乐类型的音乐,十二种语言的语音以及各种技术和非技术噪声,我们展示了该语料库在广播新闻上用于音乐 / 语音鉴别和 VAD 用于说话人识别的用途。