ICLRJun, 2021

基于结构化特征的随机梯度下降学习曲线

TL;DR研究机器学习算法(如神经网络)的泛化能力如何受数据分布结构影响,提出了一种基于随机梯度下降的可解模型来预测任意协方差结构的特征测试误差,并在各种数据集上验证其准确性;同时证明小批量 SGD 在固定计算预算下的最优批量通常较小,取决于特征相关性结构。