Jun, 2024

PRoDeliberation:面向端到端口语理解的并行强化沟通

TL;DRSpoken Language Understanding (SLU) 的关键组成部分是将语音转化为语义分析,以便进行任务执行。本研究介绍了 PRoDeliberation,一种利用基于连接主义时间分类的解码策略和降噪目标来训练稳健的非自回归思考模型的新方法。我们展示了 PRoDeliberation 实现了并行解码的延迟降低(比自回归模型提高 2-10 倍),同时保持了修正自回归思考系统的自动语音识别(ASR)误识别的能力。此外,我们进一步展示了降噪训练的设计使得 PRoDeliberation 能够克服小型 ASR 设备的限制,并对系统的每个组件的必要性进行了分析。