May, 2023

神经文本生成的一种令人沮丧的简化解码方法

TL;DR本文介绍了一种名为 Frustratingly Simple Decoding (FSD) 的超级高效的解码方法,通过构建一个基于先前生成文本的 anti-LM 来惩罚未来生成的文本,实现了神经文本生成的更好效果,且不增加额外的模型参数和计算开销。