EMNLPOct, 2023

惩罚解码:有效抑制开放式文本生成中的自我强化效应

TL;DR本研究探讨了生成开放性文本的解码算法、自我强化效应以及消减其影响的重复惩罚的有效性。我们提出了一种遗忘机制,通过忽略远距离的令牌减轻惩罚选择的负担。此外,我们引入了长度惩罚以解决过度惩罚导致的过短句子问题。我们的惩罚解码方法结合了三种策略,有助于解决采样方法与事实信息偏离的问题。实验结果表明,我们的方法在生成类似人类输出的高质量句子方面具有有效性。