Apr, 2024
链式思维引导的通用验证
General Purpose Verification for Chain of Thought Prompting
TL;DR通过探索不同的思维链和验证推理过程中的各个步骤,我们提出了三个模型应遵循的原则(相关性、数学准确性和逻辑一致性),并将这些原则应用于大型语言模型的推理步骤,以提高最终生成结果的准确性。通过使用困惑度作为额外的验证器来引导高质量解决方案的生成,我们在4种不同类型的推理任务上评估了我们的方法,涵盖了共计9个不同的数据集。实验证明,我们的方法始终优于基准生成,并且在9个数据集中的6个数据集中,优于最佳的N个采样方法。