Jun, 2024

大型语言模型中的关键神经元分析

TL;DR本研究引入了神经元归因逆向集群归因(NA-ICA)的新架构不受限于特定模型,能够有效识别大型语言模型中的关键神经元,并通过多选题回答的代理任务检查单词以外的长文本答案。经验评估证明,NA-ICA 明显优于基准方法。此外,对神经元分布的分析揭示了可见的局部区域,尤其在不同领域之间。最后,我们展示了关键神经元在知识编辑和基于神经元的预测中的潜在应用。