BriefGPT.xyz
Jul, 2022
神经赛跑降维:门控网络中的抽象动态
The Neural Race Reduction: Dynamics of Abstraction in Gated Networks
HTML
PDF
Andrew M. Saxe, Shagun Sodhani, Sam Lewallen
TL;DR
通过引入门控深度线性网络框架,研究网络结构对学习动态产生的影响并理解它与任务之间的关系,表明结构化网络中的学习动态可以被概念化为具有向共享表示的神经竞赛,我们的分析为神经网络架构与学习之间的关系提出了一般性假设,并提供了理解更复杂架构设计以及模块化和组合在解决现实问题中起的作用的数学方法。
Abstract
Our theoretical understanding of
deep learning
has not kept pace with its empirical success. While
network architecture
is known to be critical, we do not yet understand its effect on learned representations and
→