EMNLPOct, 2022

截断采样作为语言模型丢失平滑的方法

TL;DR通过混合真实分布和平滑分布的方式,该论文提出了一个改进的 top-p 或 top-k 算法来缩短神经语言模型中的文本,并介绍了一种称为 eta-sampling 的更好的算法,可以更好地生成符合人类预期的自然语言文本。