BriefGPT.xyz
Ask
alpha
关键词
polysemantic neurons
搜索结果 - 3
InceptionV1 早期视觉中缺失的曲线检测器:应用稀疏自编码器
应用稀疏自编码器 (SAEs) 于卷积神经网络的早期视觉层,发现 SAEs 可以揭示从单个神经元中难以察觉的新的可解释特征,包括填补之前空白的额外曲线检测器,并将一些多义性神经元分解为更具单一语义的组成要素,这些发现表明 SAEs 是理解
→
PDF
a month ago
附带的多义性
多义性神经元是优化任务的深度网络中的一个重要障碍,会对人工智能安全性产生影响。本研究提出了多义性的第二种可能产生方式,名为 “偶发性多义性”,并通过理论和实验证明了这种现象的存在。
PDF
7 months ago
用概念向量解开神经元表示
研究为了实现模型机制性可解释性,提出了一种方法将多义神经元解离成概念向量来达到单一概念的表征,该方法可以根据用户所需的概念级别寻找精细的概念,分析显示多义神经元可以分解成神经元的线性组合的方向,评估表明找到的概念向量编码了连贯的人类可理解的
→
PDF
a year ago
Prev
Next