Sep, 2024

小型语言模型为方程推理者

TL;DR本研究解决了小型语言模型在算术推理任务中表现不佳的问题,主要由于自然语言形式的多样性引入了高歧义性。通过引入仅使用方程的推理格式,研究表明该方法显著提升了小型模型的算术推理能力,尤其是在像T5-Tiny这样的超小型模型中表现尤为突出。