Oct, 2022

随机正交加性滤波器:深度神经网络梯度消失 / 爆炸问题的解决方案

TL;DR本文提出了一种新的神经网络结构,旨在避免消失/爆炸梯度问题,既解决了该问题,又取得了比许多其他结构更好的性能表现,它的核心思想是通过滤波和正交加和来实现非线性激活层之间的结合,从而防止梯度消失或爆炸,并成功应用于超过 50k 层和 10k 个时间步长的神经网络任务。