Jul, 2022

UserLibri: 仅使用文本进行 ASR 个性化的数据集

TL;DR通过在移动设备上使用文本数据进行语言模型的个性化,提高了针对该用户的语音识别性能。利用 LibriSpeech 语料库和 Project Gutenberg 的个性化文本,我们对 55 个用户的文字 - 语音配对数据进行了实验,并提供了 UserLibri 数据集以帮助未来个性化研究。实验结果表明,在流媒体和非流媒体模型中,我们能够降低每个用户的平均单词错误率,其中在流媒体情况下,难度较大的测试集错误率下降了 2.5%