Oct, 2022

流式语音识别的 Transformer 修正器的联合音频 / 文本训练

TL;DR本研究提供了一种联合音频 / 文本训练方法,以降低配对音频 - 文本数据的代价,并减少了模型参数和延迟,同时在 Librispeech 数据库和内部数据库上显着提高了单词错误率的 Transformer Rescorer。