May, 2020

Mask CTC:基于 CTC 和 Mask 预测的非自回归端到端 ASR

TL;DR本文提出了 Mask CTC 框架,它是一种新颖的非自回归端到端自动语音识别(ASR)框架,它通过加强 CTC 的输出来生成序列,并使用 Transformer 编码器 - 解码器进行训练。实验结果表明,相比标准的 CTC 模型,Mask CTC 模型在不同的语音识别任务中表现更优,并显著减少了推理时间。