ICLRMar, 2022

自洽性提高语言模型的思维连贯性推理能力

TL;DR本文提出了一种新的解码策略 self-consistency 来替代自我解释式激励中的贪心解码,从而在多种常识推理基准测试中提高其性能。