Jul, 2023

用声学前瞻改进 RNN-Transducers

TL;DR本文介绍一种名为 lookahead 的技术,它通过向后查看传入音频,使文本表示更具有声学基础,从而在域内外评估集上显着降低了 5%- 20%的词错误率。