Dec, 2017

在嘈杂环境中学习鲁棒的对话策略

TL;DR本文旨在通过深度强化学习学习鲁棒的对话策略,从而恢复自动语音识别和自然语言理解错误,结果表明,我们使用用户模拟器生成的对话与人类生成的对话无法区分,并且嘈杂环境下学习到的策略可以比固定基于规则的策略更快地取得相同的执行成功率。