BriefGPT.xyz
大模型
Ask
alpha
关键词
math reasoning tasks
搜索结果 - 3
自洽性提升数学推理的校准
我们设计了三种基于自洽性的成熟校准方法,用于数学推理任务的 LLM 发展。通过使用开源 LLMs(Mistral 和 LLaMA2)在 GSM8K 和 MathQA 两个流行的基准上进行评估,我们的方法在模型置信度和准确性之间建立了更好的联
→
PDF
4 months ago
LLMs 数学推理中的数据能力边界的实证研究
通过识别推理路径的最佳集合来确定推理路径增强的能力边界,通过不同类型的数据的最佳集合的混合来累积增强模型的不同能力,以较低的建设成本实现 SOTA 性能,并提供用于鲁棒性测试和教育应用的自动问题生成器。
PDF
4 months ago
EMNLP
计划、验证和切换:多样思维的集成推理
通过多样化的推理思路,XoT 提供了一个集成的解决问题框架,可以在数学推理任务中有效地选择最合适的方法,并动态地切换不同的提示方法。
PDF
8 months ago
Prev
Next