Mar, 2024
由大到小:利用弱监督提炼和提高数学词问题的数学专业知识
From Large to Tiny: Distilling and Refining Mathematical Expertise for Math Word Problems with Weakly Supervision
Qingwen Lin, Boyan Xu, Zhengting Huang, Ruichu Cai
TL;DR通过创新的两阶段框架,从大型到小型语言模型中转移数学专业知识,通过弱监督任务设置解决数学文字问题中标注成本高的挑战,并在降低计算成本的同时,在 Math23K 和 Weak12K 数据集上表现出显著改进的性能。