May, 2023

随机修正方程和 Dropout 算法的动力学

TL;DR本文研究了 dropout 过程中的梯度优化机制,使用模拟方法得出其随机修改方程,证明了 dropout 的正则化能力来自于其寻找更平稳的极小值点,实验结果表明这种机制在 dropout 的训练过程中普遍存在。