BriefGPT.xyz
Oct, 2024
用于对称机制分析的群交叉编码器
Group Crosscoders for Mechanistic Analysis of Symmetry
HTML
PDF
Liv Gorton
TL;DR
本研究针对神经网络中对称特征的手动分析问题,提出了群交叉编码器的创新方法,旨在自动发现和分析对称特征。通过在输入的变换版本中执行字典学习,本方法能够揭示特征的可解释性聚类,并显著改进了特征的不变性和复合性分析,展示了其在神经网络对称性代表性分析中的潜在影响。
Abstract
We introduce
Group Crosscoders
, an extension of crosscoders that systematically discover and analyse symmetrical features in
Neural Networks
. While
→