Oct, 2022

具有 ε- 扰动的强彩票假设

TL;DR本研究通过在预训练步骤中对权重的波动进行波动,拓展了强彩票符号假设的理论保证,从而回答了两个开放性问题:(1)通过在强编码符号假设中允许随机初始权重的 ε- 比例扰动,是否可以减少候选网络的超参数化要求?(2)SGD 的权重变化是否与这些扰动的一组好的集合相一致?我们通过扩展的剪枝方法对这些问题进行了实验验证和数学理论证明。