May, 2022

大多数激活函数可在没有过度深度的情况下赢得彩票

TL;DR深度神经网络训练中的强引理假设提出了剪枝的潜力,在 ReLU 激活函数网络中,通过从随机初始化的神经网络的子网络近似目标网络,可以用宽度呈对数比例增加、深度双倍的神经网络表示目标函数,文中证明可以实现深度加 1 的神经网络,预期可以在常用深度找到彩票票,且只需要对数超参数化。