BriefGPT.xyz
大模型
Ask
alpha
关键词
linear over-parameterization
搜索结果 - 1
深度神经网络中的低秩简约偏差
本文提出深度神经网络可归纳地更倾向于寻找低秩嵌入的解,这种偏见在网络深度和宽度,初始化和训练过程中都存在,并且能够提高 CIFAR 和 ImageNet 数据集的泛化性能。
PDF
3 years ago
Prev
Next