ICMLJun, 2021
透过梯度学会使用新标记进行神经文本生成
Straight to the Gradient: Learning to Use Novel Tokens for Neural Text Generation
Xiang Lin, Simeng Han, Shafiq Joty
TL;DR本文引入了 ScaleGrad,一种对梯度的改进方法,解决了 MLE 在训练模型中会优先使用枯燥、重复短语的问题,并通过直接操纵梯度信息使模型学习使用新颖标记,该方法不仅在无限制生成中表现良好,而且在定向生成任务中也有效。