BriefGPT.xyz
大模型
Ask
alpha
关键词
deep linear models
搜索结果 - 2
通过低维度学习动力学高效压缩超参数化深度模型
通过研究过度参数化的深度网络的学习动力学,我们揭示了各种体系结构的权重矩阵展现出低维结构,我们利用这些洞见通过减小中间层的宽度来压缩深度线性网络,实验证明这种压缩技术能够加速训练过程超过两倍,而不牺牲模型质量。
PDF
8 months ago
ICLR
深度学习的隐性偏见:渐增学习如何推动泛化
本文定义了增量学习动力学的概念并证明了在深度为多项式关系和初始化条件正确的情况下,神经网络可以展现出增量学习能力,且通过实验证明在使用深度学习模型中,梯度下降算法有助于寻找简单的模型解。
PDF
5 years ago
Prev
Next