ACLJun, 2016

基于强化学习的不确定性下自然语言生成规划

TL;DR本研究提出了一种新的基于统计规划的自然语言生成模型,它能够在存在噪声反馈的情况下(例如用户和实现器的当前生成上下文),有效地解决常见的自然语言生成问题,包括信息展示、语句长度和信息传递量等方面的折衷问题。我们采用强化学习方法训练该模型,并将其性能与先前工作中的基准性能进行了比较,结果表明,该模型的性能明显优于所有基线模型。