Jul, 2022

使用块增强变压器提升普通话语音识别

TL;DR本文提出了一种基于 Conformer 的 Block-augmented Transformer 模型来更好地利用编码器和解码器中各块的互补信息,这个模型在 AISHELL-1 语音识别任务中性能优于当前的最新模型 Conformer,并且在测试集上取得了 4.29% CER(不使用语言模型)和 4.05% CER(使用外部语言模型)。