May, 2024
通过端到端稀疏字典学习识别功能重要特征
Identifying Functionally Important Features with End-to-End Sparse Dictionary Learning
Dan Braun, Jordan Taylor, Nicholas Goldowsky-Dill, Lee Sharkey
TL;DR通过端到端稀疏字典学习方法,我们能够训练稀疏自编码器 (SAEs),从而确保学习到的特征对网络功能起到重要作用,实现了更好的网络性能解释、特征数量的减少以及样本中同时活动的特征数量的减少。