Apr, 2021

基于 Trie 深度偏置和浅层融合的上下文流式端到端语音识别

TL;DR提出了一种结合浅层融合、字典树和神经网络语言模型的方法,来利用动态的上下文信息,相比于已有的上下文偏置方法,这种方法最终的系统轻量且模块化,可以实现快速修改而无需重新训练,同时在开放域和约束化环境下都取得了显著的词错误率优化,特别是对于那些包含大部分稀有长尾词汇的语音转文字任务有着更高的表现。