BriefGPT.xyz
大模型
Ask
alpha
关键词
gsm8k benchmark
搜索结果 - 3
鲸鱼数学:释放初高中数学中 SML 的潜力
Orca-Math 是一个基于 Mistral-7B 的 70 亿参数 SLM,它能够在 GSM8k 上达到 86.81% 的准确率,无需多次调用模型或使用验证器、代码执行或其他外部工具。
PDF
5 months ago
关于提高语言模型推理能力的进展
本文介绍了一种名为 DiVeRSe 的方法,通过增加提示多样性和引入验证器来进一步提高大型语言模型的推理能力,成功地在八个基准测试中的六个上达到了最新的最先进性能,其中包括 GSM8K。
PDF
2 years ago
链式思考引导大型语言模型推理
通过 chain of thought prompting 方法,在大型语言模型中提供少量的思维链示例可以显著提高其在各类数学、常识和符号推理任务上的性能,甚至超过 fine-tuned GPT-3。
PDF
2 years ago
Prev
Next