Apr, 2024

二阶信息增强方差减少梯度中的小批量鲁棒性

TL;DR对有限和最小化问题,我们展示了在目标函数中引入部分二阶信息可以显著提高方差减小的随机梯度方法对小批量大小的稳健性,从而使其在保留传统牛顿类型方法的优势的同时更具可伸缩性。