Jun, 2022
数据精简的彩票票:在稀疏可训练网络中寻找初始化参数
Lottery Tickets on a Data Diet: Finding Initializations with Sparse Trainable Networks
Mansheej Paul, Brett W. Larsen, Surya Ganguli, Jonathan Frankle, Gintare Karolina Dziugaite
TL;DR通过数据分布和损失面景观的角度,我们研究了 IMP 的预训练阶段如何为好的初始化做出贡献,得出了在密集网络的损失面景观中更多的线性模式连接示有利于 IMP 性能的结论。