Jul, 2023

正则化对损失函数的几何影响

TL;DR神经网络学习的关键取决于损失函数的几何形态,我们通过研究不同的正则化方法对函数的几何形态的影响,发现在非线性深度神经网络中,正则化前的损失函数通常不是莫尔斯函数;我们考虑了几种不同的正则化方法,包括权重衰减,研究发现哪些正则化方法可以使得正则化后的函数成为莫尔斯函数。