MMJan, 2022

通用手机:用于鲁棒声学建模的多语言数据集

TL;DR本研究介绍了多语言语音数据集 Common Phone,用其于 Wav2Vec 2.0 音频模型的参数训练并取得了 18.1% 的识别率,提供了可靠的注音,从而缩小了声学模型应用于实际场景的差距。