Jul, 2023
融合预训练的ASR和LM进行语音理解的序列生成
Integrating Pretrained ASR and LM to Perform Sequence Generation for
Spoken Language Understanding
TL;DR我们提出了一个三步走的端到端SLU系统,将预训练的语音识别模型和语言模型有效地集成到SLU框架中,以用于序列生成任务。该系统在ASR和LM子网络的基础上进行预测,最终预测基于ASR和LM子网络的表示结果。我们的三步走SLU系统在两个基准SLU数据集(SLURP和SLUE)上表现出卓越性能,尤其在具有挑战性的音频对话中的表现更好。