BriefGPT.xyz
Aug, 2024
通过权重的谱动态来研究深度学习
Approaching Deep Learning through the Spectral Dynamics of Weights
HTML
PDF
David Yunis, Kumar Kshitij Patel, Samuel Wheeler, Pedro Savarese, Gal Vardi...
TL;DR
本研究针对深度学习中的一些现象存在的统一和澄清的需求,提出了一种以权重的谱动态为中心的实证方法。研究发现,谱动态不仅能区分记忆网络与泛化网络,还能解释稀疏子网络(彩票票据)的出现及损失表面的结构,其结果为理解神经网络在多种环境中的行为提供了一个连贯的框架。
Abstract
We propose an empirical approach centered on the
Spectral Dynamics
of weights -- the behavior of singular values and vectors during
Optimization
-- to unify and clarify several phenomena in
→