Oct, 2024
数学神经外科:仅通过前向传播 isolating 语言模型的数学推理能力
Math Neurosurgery: Isolating Language Models' Math Reasoning Abilities
Using Only Forward Passes
TL;DR本研究解决了大语言模型(LLM)中数学推理能力编码的不足,提出了数学神经外科(MathNeuro)的方法,通过仅使用前向传播来孤立数学特定参数。研究发现,通过剔除影响通用语言任务的重要参数,可以在不影响LLM的语言能力的情况下提高其数学性能,提升幅度达4-17%。