Jun, 2021

代理凸性:梯度下降训练的神经网络分析的统一框架

TL;DR本文提出了一个统一的非凸优化框架,用于分析神经网络训练,引入了代理凸性和代理 Polyak-Lojasiewicz (PL) 不等式的概念,结合梯度下降,对神经网络训练的目标函数提供了高效的保证。通过代理凸性和代理 PL 不等式,本文进一步揭示了许多现有的神经网络训练保证的统一性。