Feb, 2020
Transformer Transducer:基于Transformer编码器和RNN-T Loss的可流式语音识别模型
Transformer Transducer: A Streamable Speech Recognition Model with
Transformer Encoders and RNN-T Loss
TL;DR该论文提出了一种端到端的语音识别模型,使用Transformer编码器可用于流媒体语音识别系统;该模型在LibriSpeech数据集上进行了实验结果,结果表明限制Transformer层中自注意力左侧上下文对于流式解码是可行的,并展示了我们的全注意力模型在LibriSpeech基准测试上的准确性优于现有技术水平。