Apr, 2017

使用坐标轴下降算法训练带L1正则项的模型

TL;DR本文提出了基于维度的被动下降算法(OPDA),它使用了随机变量减少梯度(SVRG)来初始化下降方向,并应用了一种新的对齐操作来促进每个元素在更新后保持相同的符号,从而参数保持在之前的正半轴。它还明确抑制了每个元素的大小,以强加稀疏性,演示了OPDA在训练稀疏模型方面的超越现有的随机近端算法,并在总体上得到验证。