BriefGPT.xyz
大模型
Ask
alpha
关键词
program-of-thought
搜索结果 - 2
SAAS:增强大型语言模型数学推理的解决能力放大策略
本研究提出了一种新颖的学习方法,旨在增强大型语言模型的数学推理和问题解决能力。通过整合思维链和思维方案的学习,以解决数学问题为重点,提出了一种名为 SAAS 的顺序学习方法。经过广泛的性能比较实证研究,结果表明我们的 SAAS 在数学推理领
→
PDF
3 months ago
混合蒸馏助于小型语言模型更好地进行推理
通过 Mixed Distillation 框架,将大语言模型的 Program-of-Thought 和 Chain-of-Thought 的能力转移到较小模型中,提高较小模型的性能,优于传统蒸馏方法,并在多路径推理中实现了令人印象深刻的
→
PDF
6 months ago
Prev
Next