BriefGPT.xyz
Ask
alpha
关键词
spectral norms
搜索结果 - 3
利用凸分析和 ODE 设计稳定的神经网络
本文提出了一种 ResNet 风格的神经网络架构,编码非扩张(1-Lipschitz)算子,不同于普通的 ResNet 架构,该架构的 Lipschitz 常数不会随着网络深度的增加而呈指数级增长。进一步分析表明,权重的谱范数可以进一步约束
→
PDF
a year ago
一类循环神经网络的泛化界限
研究对循环神经网络的推广能力,通过探究四种变体,包括最小门单元、长短期记忆和卷积循环神经网络,建立了 PAC-Learning 框架下的推广界限,并在额外的规范假设下建立了更加精细的推广界限,与现有结果相比,说明了这些变体在推广中的优势。
PDF
5 years ago
ICLR
通过泛化噪音鲁棒性,确定性 PAC-Bayesian 深度网络泛化界
本文研究了过参数化的深层网络使用随机梯度下降法(SGD)能够良好推广的能力,提出了一种 PAC-Bayesian 框架,利用这种能力为原始网络提供界限,同时不会受到权重矩阵谱范数乘积的影响。
PDF
5 years ago
Prev
Next