Sep, 2021

适应性梯度门控稀有符号降级所有符号:通过稀有符号嵌入改进神经文本生成

TL;DR本研究分析了Neural Language Model中Token Embeddings 的训练动态,探讨了少见Token Embeddings 梯度的特定部分是引起表示退化问题的关键原因,并基于此提出一种名为自适应梯度门控(AGG)的新方法来解决此问题,实验证明了AGG的有效性。