ICLRJan, 2024

逃离高昂成本:多步推理的早停自一致性

TL;DR我们提出了一种简单且可扩展的采样过程 ESC,用于减少 Self-consistency 的成本,并在不牺牲性能的情况下动态选择性能成本平衡的控制方案。通过在算术、常识和符号推理任务上进行实验证明,ESC 显著降低了链式思维推理的平均采样数量,同时具有可比性的性能。