Jun, 2022

数据精简的彩票票:在稀疏可训练网络中寻找初始化参数

TL;DR通过数据分布和损失面景观的角度,我们研究了 IMP 的预训练阶段如何为好的初始化做出贡献,得出了在密集网络的损失面景观中更多的线性模式连接示有利于 IMP 性能的结论。