EMNLPAug, 2018

使用多个答案学习端到端面向目标的对话

TL;DR该研究工作关注基于目标导向的对话系统中的问题,提出了一种使用监督学习和强化学习方法的新方法,并引入了多个有效的下一个话语来评估具有更现实设置的目标导向性对话系统。通过引入多种有效的下一个话语,该文改进了原始 bAbI 对话任务,现有的端到端神经方法的表现从原始 bAbI 对话任务的 81.5% 下降到 permuted-bAbI 对话任务的 30.3%,而其提出的方法则取得了 47.3% 的准确度。