Mar, 2022

流式并行传感器束搜索算法及快慢级联编码器

TL;DR该研究提出了在流式自动语音识别中应用串联有因果和非因果编码器的方法,并使用两个有不同输入上下文大小和以不同的音频间隔产生输出的流式非因果编码器进行改进;同时提出了一种新的并行时间同步波束搜索算法。研究结果表明,在公共数据集 Librispeech 和内部数据集上,该算法在稍微增加音节延迟的情况下,实现 WER 降低 20%左右,并探索了分布式处理和共享参数降低内存占用的技术,以实现低计算成本和低内存占用的边缘设备上的低延迟处理。