BriefGPT.xyz
大模型
Ask
alpha
关键词
risk convergence
搜索结果 - 1
梯度下降对齐深度线性网络的层
本篇论文研究了在线性可分数据上应用于深度线性网络的梯度流和梯度下降的风险收敛和渐进权重矩阵对齐 —— 一种隐式正则化方法,详细说明了在套用于严格递减损失函数时(梯度下降的递减步长也是如此):(i) 风险趋近于 0;(ii)标准化的第 i 个
→
PDF
6 years ago
Prev
Next