May, 2017

通过梯度下降学习 ReLU

TL;DR本文研究学习呈现形式为 $max (0,<w,x>)$ 的修正线性单元(ReLUs)的问题,聚焦于高维场景下,权重向量的维数大于样本数的情形,针对实现可能性模型,展示了投影梯度下降算法在 0 处初始化的线性收敛率,这一结果对于深度架构的动态具有一定的参考价值。