Feb, 2024

学会检查:释放大型语言模型中的自我纠正潜能

TL;DR通过精心设计的训练数据、详细分析数学推理中的错误类型并构建了一个自检修正数据集,本研究旨在增强大型语言模型的自检能力,从而提高自我修正的准确性。在与其他检查 - 修正数据相关的情境中,使用 “Step CoT Check” 提示进行微调的模型表现更好,提供更精确的反馈,从而达到更高的正确率。