Jan, 2020

基于 Transformer 的 CTC/注意力机制在线端到端语音识别架构

TL;DR本论文介绍了基于Transformer的在线CTC/Attention E2E ASR架构,该架构包括块自注意力编码器和基于单调截断注意力的自注意力解码器,通过将块自注意力编码器和基于单调截断注意力的自注意力解码器集成到在线CTC/Attention架构中,实现了在线语音识别,与离线基线相比,具有最低为0.19%的CER衰减和显着的性能提升。