Sep, 2023

对比解码提升大型语言模型的推理能力

TL;DR利用对比解码方法生成的文本展现在各种推理任务中相比贪婪解码有着显著的提升,并在HellaSwag常识推理基准测试中胜过LLaMA 2、GPT-3.5和PaLM 2-L,在GSM8K数学词语推理基准测试中超过LLaMA 2、GPT-3.5和PaLM-540B,同时在其他任务中也有进步。分析表明,对比解码通过防止一些抽象推理错误和避免简单的复制输入部分来改善现有方法,从而在长文本生成和推理任务方面优于核心取样和贪婪解码,使其成为从语言模型生成文本的强大通用方法。