Apr, 2018

通过近似恒等函数的复合表示平滑函数,对深度网络优化的影响

TL;DR通过使用拟恒等非线性映射的叠加来表示平滑的双 Lipschitz 函数,并展示了深度残余网络以及其非线性层计算小 Lipschitz 常数函数的能力,使用功能梯度方法避免了子优区域和失效的临界点,与固定大小的残差网络和 sigmoid 激活函数的参数梯度方法相比,其是一个更优的方法。