BriefGPT.xyz
Ask
alpha
关键词
max-margin direction
搜索结果 - 1
在稳定边缘处进行逻辑回归的梯度下降隐含偏差
本文研究了边缘稳定性(EoS)中逻辑回归上梯度下降(GD)的收敛和隐式偏差情况,证明任何恒定步长的非单调 GD 迭代可以在较长时间尺度上最小化逻辑损失,并在最大间隔方向上趋于正无穷,在最大间隔方向的正交补上收敛于最小化强凸势能的固定向量,而
→
PDF
a year ago
Prev
Next