NIPSOct, 2015

深度强化学习生成文本

TL;DR提出了一种基于深度强化学习(Deep Q-Network, DQN)的序列到序列学习中,通过迭代的方式对输出序列进行解码的新型模式,旨在使解码器优先处理较为容易的序列部分,然后再处理较为困难的部分。