May, 2024

SED: 自我评价解码增强大型语言模型以实现更好的生成

TL;DR现有的大语言模型通过单向自回归解码方法生成文本,但这种方法在处理不确定 token 时容易遇到次优选择,而该研究提出了一种名为 SED 的自我评估解码方法以优化模型生成。实验结果表明 SED 在各种任务和不同模型上具有良好的效果。