BriefGPT.xyz
大模型
Ask
alpha
关键词
reasoning errors
搜索结果 - 4
DOP:面向诊断的提示在数学纠错中的应用
研究论文通过改善大型语言模型的错误修正能力,以及提出面向诊断的提示方法 (DOP),对数学世界问题修正进行研究,重点在于辨别数学推理与错误修正,以及强调在数学教育中优秀的修正更胜于熟练的推理。
PDF
a month ago
演绎搜索:链式思维推理的可推导理由解码
通过 Deductive Beam Search 的有机结合,我们的方法显著提高了不同规模的 Large Language Models 在算术、常识和符号等 3 个推理领域的性能,并证明其在检测多样且微妙推理错误以及对不同模型规模的鲁棒性
→
PDF
5 months ago
用 Flip-Flop 语言建模揭示注意力漏洞
本文研究了语言模型存在的错误和推理失误现象,特别是对于长链推理问题的脆弱性,提出了认知故障这一现象,并通过引入翻转语言建模进行了分析,讨论了自注意力机制失效的原因和解决方法。
PDF
a year ago
ROSCOE: 评分逐步推理的一套度量指标
本研究提出了 ROSCOE,这是一种可解释且无监督的自动评分方法,可以测量大型语言模型的语义连贯性,逻辑性,信息量,流畅度和事实性,分别针对人类注释和程序干扰的诊断数据集进行了实证验证并证明其效果优于基线方法。
PDF
2 years ago
Prev
Next