BriefGPT.xyz
Ask
alpha
关键词
neuron behavior
搜索结果 - 2
从神经元到图形:大规模解释语言模型神经元
该论文介绍了一种自动化的方法来解释大型语言模型中的神经元行为,并将其转化为可解释的图形表示,从而提高大型语言模型的可解释性和安全性。
PDF
a year ago
神经元的组合解释
我们使用一种解释深度学习表征中神经元的程序,通过识别与神经元行为密切相关的组合逻辑概念来实现,以比先前使用原子标签的解释方法更精确地描述他们的行为,并回答了一些有关视觉和自然语言处理模型可解释性的问题。
PDF
4 years ago
Prev
Next