Mar, 2024

结构化神经网络训练的正则化自适应动量双平均方法和高效非精确子问题求解器

TL;DR我们提出了一种用于训练结构化神经网络的正则化自适应动量双重平均(RAMDA)算法,通过引入一个有效求解子问题的方法,RAMDA 可以输出具有优秀预测性能和(局部)最佳结构的模型。