Sep, 2018

基于奖励塑造的可控神经故事情节生成

TL;DR通过引入 reward-shaping 技术的方法,研究表明,基于语言模型的故事情节生成方法可以生成满足特定目标的故事情节,并且比基线情节生成技术具有更合理的事件顺序。