Oct, 2021

神经网络权重不会收敛到稳态点:一个不变测度的角度

TL;DR通过数值证据和动力系统的遍历理论,在大规模神经网络训练中解释了权重不收敛于稳态点但损失函数值停止下降和训练损失稳定的现象,探讨了一种新的基于动力系统的权重分布演化方式的优化理解方法。