研究了全连接前馈深度神经网络中对称中心稳定分布下权重和偏置的独立同分布,证明了相应加权后权重的无穷宽极限是一种随机过程,其有限维分布是多元稳定分布。这一极限过程被称为稳定过程,并且扩展了最近利用高斯无穷宽极限进行的研究线路。
Mar, 2020
本文研究基于高斯过程的无限宽神经网络的有限宽度情况,通过积分消除随机变量实现层间激活分布的跟踪,推导出非高斯过程作为其先验,并发展了一种弱非高斯先验下的贝叶斯推断扰动程序。
Sep, 2019
基于无限宽度神经网络的高斯过程,并结合内核和推理方法,构建了一个场论的形式体系,研究了无限宽度网络的泛化性质,并从输入数据的统计性质得到了泛化性质的提取。
Jul, 2023
本文研究深度学习模型的不确定性估计问题,基于神经网络高斯过程构建了一个概率模型,能够更好地校准模型并比较有限和无限宽模型的表现差异,同时也考虑了分类问题和迁移学习等实际应用场景。
Oct, 2020
本文研究了随机初始化的宽神经网络能否通过高斯过程来近似。我们在一个无限维函数空间中建立明确的收敛速率,说明了两种不同的情况:同时激活函数的次数和函数的平滑度会决定高斯过程的收敛速度。
Feb, 2021
本文提出了一种基于高斯随机变量尺度混合的 NNGPs 模型,并利用先验分布在最后一层参数上引入尺度先验,使得任何架构的无穷宽神经网络都能转化为一种更丰富的随机过程,通过实验进一步证明了该模型在回归和分类任务方面的可行性和鲁棒性。
Jul, 2021
本文通过严密推导,针对贝叶斯两层神经网络在无穷宽度限制下采用变分推断方法进行回归任务训练,证明了它们的中心极限定理(CLT)。该研究比较了不同网络训练方案的波动行为,发现最小化变分推断方法在计算复杂度上具有更高效的优势。
Jun, 2024
本研究结合随机神经网络和张量程序的概念,研究了神经网络的收敛性和梯度动态性,在多种不同体系下,从而表明了该框架不仅可以引导更强的高斯过程的设计,而且还可以深入理解现代架构中的 SGD 动态。
Feb, 2019
本文研究了具有大规模参数的人工神经网络,并探究了正态性的校正、宽神经网络的演化控制、与高概率训练的全局最小值等。
Apr, 2023
本文研究无限宽深层神经网络和高斯过程的等价性,提出一种计算高斯过程协方差函数的有效方法,并使用该方法在 MNIST 和 CIFAR-10 上进行了贝叶斯推断,在网络宽度增加时,训练神经网络的准确率和 GP 预测的不确定性分别增加,而有限宽度训练网络越接近 GP,测试性能越好,GP 预测通常优于有限宽度网络的预测,最后将这些 GP 的性能与随机神经网络的信号传播理论相联系。
Nov, 2017