Feb, 2018

用优化几何表征隐含偏见

TL;DR研究了通用优化模型,如镜像下降、自然梯度下降和最速下降在欠定线性回归或可分线性分类问题上的隐式偏差以及关于算法得到的特定全局最小值是否可以独立于超参数选择,如步长和动量,用优化几何势或范数表征。