BriefGPT.xyz
大模型
Ask
alpha
关键词
monosemantic neurons
搜索结果 - 2
崛起学习:由新兴能力和单义性基础的研究
通过研究不同规模的模型,我们发现在大型模型中达到更高性能的关键因素是单语义神经元的减少,提出了一种主动抑制单语义性的两阶段方法,并通过理论分析和实验证明了其有效性。该方法的适用性不限于大规模,但对于研究部门来说,将该研究扩展至非常大规模的数
→
PDF
7 months ago
玩具模型中的单一语义工程
本文尝试利用训练过程中的局部最小值改变神经元内在特征,以提高神经网络的可解释性并减少偏差,并发现每层神经元数量的增加可以提高单语性,但会增加计算成本。
PDF
2 years ago
Prev
Next