Oct, 2022
流式语音识别的 Transformer 修正器的联合音频 / 文本训练
Joint Audio/Text Training for Transformer Rescorer of Streaming Speech Recognition
Suyoun Kim, Ke Li, Lucas Kabela, Rongqing Huang, Jiedan Zhu...
TL;DR本研究提供了一种联合音频 / 文本训练方法,以降低配对音频 - 文本数据的代价,并减少了模型参数和延迟,同时在 Librispeech 数据库和内部数据库上显着提高了单词错误率的 Transformer Rescorer。