ICLROct, 2022

非单调自终止语言模型

TL;DR本文研究大规模神经自回归序列模型的生成算法在 greedy search、beam search、top-k sampling 和 nucleus sampling 的情况下呈现的非终止、重复和过早中止等退化属性,提出了一个非单调自动终止语言模型,该模型通过放宽自动终止概率单调递增的限制来解决该问题,并证明了该模型不仅能防止非终止序列,而且还能在采用 beam search 等其他算法时使用。