Aug, 2022

自然对话语言的交替预测

TL;DR本论文提出了一个基于端对端语音识别器的取向预测器,通过检测用户何时停顿思考或讲完话来联合优化 ASR 任务和取向预测任务,以更好地建模对话交互。测试集表明,该方法在识别包含四类语言障碍的会话句子时,具有 97% 以上的准确率和 100 毫秒的延迟。