Sep, 2018

残差网络通过通用的激活函数实现动态等比特性

TL;DR本文研究了残差神经网络中动态同构的可达性,借助自由概率和随机矩阵理论,我们导出了初始化时输入输出雅可比矩阵谱密度的通用公式,在大型网络中我们得到了一个依赖于单个参数的奇异值谱,并分析了各种常见激活函数的信号传播,我们通过随机矩阵和 CIFAR-10 分类问题的数值模拟证实了结果,并研究了这种普适性行为对学习过程的影响,最后得出结论:在初始化时选择相同水平的动态同构可以消除激活函数的影响,促进学习。