Nov, 2016

序列导师:带有KL控制的序列生成模型的保守微调

TL;DR本文提出了一种改善递归神经网络 (RNN) 生成序列结构和质量的通用方法,同时保持数据原本学习的信息和样本多样性,首先使用最大似然估计 (MLE) 对 RNN 进行预训练,接着通过强化学习 (RL) 训练另一个 RNN 生成高质量的输出,该方法在生成新的音乐旋律和计算分子结构中均表现出良好效果。