BriefGPT.xyz
Ask
alpha
关键词
nonlinear neural networks
搜索结果 - 4
Dropout Drops Double Descent
本论文发现并分析了只需要在全连接层之前添加一个 dropout 层,我们就可以轻松避免双峰下降现象。我们通过理论和实验证明,在线性回归模型和非线性随机特征回归中使用最优 dropout 可以缓解双峰下降现象,并通过 Fashion-MNIS
→
PDF
a year ago
ReLU 网络在平方损失下的隐式正则化
针对非线性神经网络的回归损失(如平方损失),研究其隐含正则化(即隐含偏差)的特性,虽然已成为一个活跃的研究领域,但迄今为止仍未得到深入探究。本文通过一些证明,表明甚至对于单个 ReLU 神经元,无法利用原模型参数的任何显式函数来表征隐含正则
→
PDF
4 years ago
基于深度项目的协同过滤进行 Top-N 推荐
通过使用非线性神经网络来建模更高阶级别的电影推荐系统中交互产品之间的关系并使用注意力网络来建模更精细的第二阶交互,可以有效地提高推荐质量。
PDF
6 years ago
ICLR
深度神经网络的全局最优条件
该论文研究了使用平方误差损失函数的深度线性和非线性神经网络的误差景象。对于深度线性神经网络,研究者提出了必要和充分条件,以判断风险函数的一个临界点是否为全局最小值,并且这些条件提供了一种高效检查全局最优性的方法。论文还将这些结果扩展到深度非
→
PDF
7 years ago
Prev
Next