ICMLJun, 2021

透过梯度学会使用新标记进行神经文本生成

TL;DR本文引入了 ScaleGrad,一种对梯度的改进方法,解决了 MLE 在训练模型中会优先使用枯燥、重复短语的问题,并通过直接操纵梯度信息使模型学习使用新颖标记,该方法不仅在无限制生成中表现良好,而且在定向生成任务中也有效。