Jun, 2024

复杂分形可训练性边界可由微不可见的非凸性产生

TL;DR通过研究梯度下降中的学习率与损失函数之间的关系,我们发现简单的非凸扰动可以导致分形可训练性边界,这一发现有助于更好地理解神经网络训练过程中的复杂行为,从而提高训练策略的一致性和可预测性。