ICMLJun, 2024
更稀疏,更好,更深,更强:通过精确正交初始化改进稀疏训练
Sparser, Better, Deeper, Stronger: Improving Sparse Training with Exact Orthogonal Initialization
Aleksandra Irena Nowak, Łukasz Gniecki, Filip Szatkowski, Jacek Tabor
TL;DR提出了一种基于随机 Givens 旋转组合的精确正交初始化方案(Exact Orthogonal Initialization,EOI),该方法能够在静态稀疏训练中实现高效稀疏的 1000 层 MLP 和 CNN 网络的训练,突出了在静态稀疏训练中权重初始化和稀疏掩码选择的关键作用。