Apr, 2024

评估数学推理能力的准确性以外的因素

TL;DR通过有效性和冗余性评估推理质量,我们提出了 ReasonEval 方法,该方法在数学任务中表现优异,并发现提高最终答案准确性并不一定能改善复杂数学问题推理步骤的整体质量。