ACLMar, 2018

大型领域对话管理中的封建强化学习

TL;DR本文提出了一种以 Feudal RL 为基础的对话管理架构,利用领域本体结构信息抽象出对话状态空间,并在不需要额外奖励信号的情况下,在几个对话领域和环境中显著优于先前的最新成果。