Apr, 2022

面向目标导向对话系统的上下文感知语言建模

TL;DR通过将目标为导向的对话形式化为部分可观测的马尔可夫决策过程,并将语言模型解释为动态和策略的表示,我们提出了一种简单有效的方法,即任务重新标记,以目标感知的方式微调语言模型,从而显著提高了任务性能,达到了人类水平的任务表现。我们还引入了一些训练策略,以更好地聚焦于手头的任务。我们使用 AirDialogue 在实际的航班预订任务上评估了我们的方法 Context-Aware Language Models(CALM),在任务成功率方面,CALM 的表现优于现有技术方法 7%。