BriefGPT.xyz
大模型
Ask
alpha
关键词
overparameterized deep neural networks
搜索结果 - 3
魔术般地减小切比雪夫原型风险消除过拟合的危险
通过分析深度神经网络中特征提取层的激活输出,我们发现修正后的类内特征协方差和跨类原型分离是误分类概率的基本切比雪夫上界的关键组成部分,我们将其称为切比雪夫原型风险(CPR)。我们的实验结果显示,我们的训练算法在多个数据集和网络结构中减少了过
→
PDF
3 months ago
ICML
深度神经网络的惰性训练下的良性过拟合
该论文探讨和证明了过参数化的深度神经网络利用懒惰训练策略可以实现贝叶斯最优测试误差,同时获得(几乎)零训练误差,并提出了三个相关概念的统一。
PDF
a year ago
学习外推:一种横式学习方法
本文研究了利用和超参数微调相关的重新参数化策略,增强深度学习系统在特定条件下的组合泛化能力,从而解决超域外推问题。该方法在各种监督学习和模仿学习任务中均具有实用性。
PDF
a year ago
Prev
Next