May, 2023

RCOT:通过逆向思路链来检测和纠正推理中的事实不一致性

TL;DR本文提出了一种新方法 RCoT,通过自动检测和纠正 LLMs 生成的解决方案中的事实不一致性,以 fine-grained feedback 指导 LLMs 修改解决方案,从而改进 LLMs 在算术推理任务中的推理能力。实验结果表明,RCoT 相对于标准的 CoT 在七个算术数据集上有一致的改进。此外,发现手动编写的精细反馈可以显着提高 LLMs 的推理能力,并鼓励社区进一步探索 fine-grained feedback 生成方法。