Sep, 2022

BOME! 一种简单的一阶方法实现双层优化

TL;DR本文提出了一种基于一阶梯度信息的简单双层优化算法,适用于深度学习中大规模的非凸函数,无需隐式微分,并有指导其在非凸优化问题上收敛于驻点的收敛性分析证明,实验结果表明其优越的性能表现。