BriefGPT.xyz
大模型
Ask
alpha
关键词
convergence direction
搜索结果 - 1
ICLR
线性神经网络训练中隐性偏差的统一视角
研究了线性神经网络训练中渐进流(即用无穷小步长的梯度下降法)的隐含偏差;提出了神经网络的张量形式,包括全连接、对角线和卷积网络等特例,并研究了称为线性张量网络的公式的线性版本。通过这个公式,我们可以将网络的收敛方向表征为由网络定义的张量的奇
→
PDF
4 years ago
Prev
Next