Mar, 2022

基于 Transformer 的流式端到端自动语音识别中的平移块编码器

TL;DR提出一种基于移位块机制的 SChunk-Transformer 和 SChunk-Conformer 模型,可以较好地解决全局上下文建模和训练效率问题,在 AISHELL-1 测试集上分别取得 6.43% 和 5.77% 的 CER 准确率,与传统的块式模型相比性能更佳。