Aug, 2023

使用XLSR-53的印尼语自动语音识别

TL;DR本研究基于XLSR-53预训练模型开发了印尼自动语音识别(ASR)系统,使用该模型能显著减少所需的非英语语言训练数据以达到竞争性的词错误率。研究使用了总计24小时、18分钟、1秒的数据,通过使用语言模型可以将词错误率从20%降低到12%。这些研究结果对于创造更好的印尼ASR系统并减少数据量方面进行了完善。