BriefGPT.xyz
Dec, 2023
TinyGSM: 使用小型语言模型在GSM8k上达到80%以上
TinyGSM: achieving >80% on GSM8k with small language models
HTML
PDF
Bingbin Liu, Sebastien Bubeck, Ronen Eldan, Janardhan Kulkarni, Yuanzhi Li...
TL;DR
通过使用小规模模型并结合高质量的数据集,我们的研究探索了如何提升小型语言模型在解决小学数学问题时的数学推理能力,并通过引入 TinyGSM 数据集和验证器的方法,实现了在 GSM8K 基准测试中超过 80% 的准确率,同时在模型规模上远远超过现有模型。
Abstract
small-scale models
offer various computational advantages, and yet to which extent size is critical for
problem-solving abilities
remains an open question. Specifically for solving
→