Oct, 2020

Align-Refine: 迭代实时对准实现非自回归式语音识别

TL;DR本研究提出了一种基于迭代重对齐的端到端 Transformer 模型,在语音识别中优化了 CTC(Connectionist Temporal Classification)对齐,允许长度可变的插入和删除操作。该模型在一个迭代过程中具有很强的性能,甚至具有更浅的编码器。