Apr, 2023

深度神经网络中的临界性与均匀性

TL;DR本文研究了沿着混乱边缘初始化的深度前馈网络,发现其具有指数级的培训能力。同时探讨了tanh激活函数的饱和效果,发现这个效果会影响到混乱边界的训练效率,并提出了最大熵的相空间平衡特性。研究表明,在混乱边缘初始化是实现最优训练能力的必要条件,但不足以满足这个目标。