BriefGPT.xyz
Ask
alpha
关键词
whitened data
搜索结果 - 2
ICML
通过凸对偶揭示深度神经网络的结构
本文研究正则化深度神经网络及其隐层结构,通过凸分析框架构建问题的最优隐层权重,证明 For 深度 ReLU 网络,权重矩阵与之前的层通过对偶对齐,并给出了数据为基态或白话时的权重的解析解。同时,该研究也可以甚至适用于具有批归一化架构的深度神
→
PDF
4 years ago
ICLR
深度线性神经网络梯度下降的收敛分析
本文研究在白化数据上,通过梯度下降来训练深度线性神经网络收敛到全局最优点的速度。当隐藏层数的维度不小于输入输出维度的最小值,并且初始化的权重矩阵大致平衡且初始损失小于任何秩缺失解时,可保证线性收敛。此外,在输出维度为 1 的情况下,即标量回
→
PDF
6 years ago
Prev
Next