Sep, 2022

用于流式语音识别的卷积增强循环神经网络转录器 (ConvRNN-T)

TL;DR本文主要介绍了一种新的流式自动语音识别模型 - 基于卷积增强循环神经网络传导器 (ConvRNN-T),其中,作者通过引入局部和全局上下文 CNN 编码器作为卷积前端来增强 LSTM 的 RNN-T,并展示了其性能优于 RNN-T,Conformer 和 ContextNet 等现有的技术。此外,ConvRNN-T 具有更低的计算复杂度和更优的性能表现,是一种有前景的流式自动语音识别技术。