ACLJun, 2024

研究神经元激活作为统一视角来解释 LLM 的引发思维链的算术推理

TL;DR通过研究神经元激活,我们探索了大型语言模型中算术推理能力的重要性,以及神经元激活对 CoT 提示的 components 的影响,并提出了一个基于 GPT-4 的方法来自动识别涉及算术推理的神经元。