Oct, 2024

理解深度学习中的优化与中心流

TL;DR本研究解决了深度学习优化过程理解不清的问题,提出了一个新的“中心流”思想,通过差分方程捕捉优化轨迹的时间平均行为。研究发现,这些中心流能够准确预测神经网络的长期优化轨迹,并揭示了自适应优化器如何通过调节步长来更有效地处理损失景观。