Sep, 2024

去混淆的因果感知参数高效微调:改善大型语言模型的解题能力

TL;DR本研究针对大型语言模型在推理任务中的不足进行了深入探讨,尤其是在数学和物理问题的解决上。我们提出了去混淆因果适应(DCA)方法,通过构建因果框架来增强模型的推理能力,并在多个基准测试中显示出优于传统微调方法的效果,展示了其在提高大型语言模型的准确性和可靠性方面的潜力。