BriefGPT.xyz
Ask
alpha
关键词
ntk theory
搜索结果 - 3
深度线性神经网络联邦平均的神经切线核视角
使用 NTK 理论进一步提供对联邦平均(FedAvg)在训练深度线性神经网络方面全局收敛的第一个理论保证,通过实验评估验证了理论发现的正确性。
PDF
9 months ago
超参数神经网络动量法的高分辨率动态视角
本研究分析了在训练神经网络时,动量法中的 Heavy Ball 和 Nesterov 方法的收敛性差异,通过高分辨率动态系统和神经切向核理论对具有 ReLU 激活函数的过度参数化双层神经网络进行收敛分析。结果显示 Nesterov 方法比
→
PDF
2 years ago
神经网络定位锚定实现的分布外检测
本文目的在于利用异方差温度缩放作为一种校准策略来检测非分布数据。提出一种新的训练策略,称为锚定,可以估计每个样本的适当温度值,从而实现在几个基准测试中最先进的 OOD 检测性能。通过实验研究,我们建立了一种高度有效的 OOD 检测方法。
PDF
2 years ago
Prev
Next