ICMLNov, 2019

基于强化学习的自然语言生成与外部奖励

TL;DR使用双向编码器 - 解码器、外部奖励和注意力机制,结合强化学习创造自然语言生成的方法,并通过标准对话语料库验证其有效性。