BriefGPT.xyz
Ask
alpha
关键词
feature directions
搜索结果 - 2
量化语言模型中的特征稀疏性
最近的研究工作提出了一种假设,即语言模型中的激活可以被建模为对应于输入文本特征的向量的稀疏线性组合。在这个假设下,这些工作旨在使用稀疏编码重构特征方向。我们开发了度量方法来评估这些稀疏编码技术的成功,并测试线性和稀疏假设的有效性。我们展示了
→
PDF
9 months ago
ICML
神经网络表示中的特权和收敛基础
通过研究神经网络所学到的表示是否具有特权和趋同基础,本研究旨在探究个别神经元所表示的特征方向的重要性。结果表明,与线性网络不同,神经表示的任意旋转无法被逆转,证明其不具备完全的旋转不变性。同时,通过比较具有相同参数但具有不同随机初始化的网络
→
PDF
a year ago
Prev
Next