Jan, 2024

基于凸差分函数的神经网络参数优化的全局收敛算法

TL;DR我们提出了一种优化单隐藏层神经网络参数的算法,其中我们导出了目标函数的分块凸差(DC)函数表示。基于后者,我们提出了一种分块坐标下降(BCD)方法,将其与定制的凸差函数算法(DCA)结合起来。我们证明了所提算法的全局收敛性。此外,我们在理论上分析了参数的收敛速度和值的收敛速度(即训练损失)。我们给出了算法收敛线性或甚至更快的条件,取决于损失函数的局部形状。我们通过数值实验验证了理论推导的正确性,并在训练损失和测试损失方面将我们的算法与最先进的基于梯度的求解器进行了比较。