将线性拉普拉斯模型证据应用于现代深度学习
本文介绍了一种叫做 Laplace approximation (LA) 的 Bayesian 神经网络逼近算法,该算法可以实现更好的不确定性估计和模型选择,并通过实验证明其在计算成本上具有优势。
Jun, 2021
本文提出了一种新的方法(L2M),通过使用Adagrad等优化器已经估算出来的梯度二次矩来构造Laplace近似,而不需要计算曲率矩阵。该方法不需要改变模型或优化器,可以通过几行代码实现,并且不需要引入任何新的超参数。我们希望该方法能为深度神经网络的不确定性估计开辟新的研究方向。
Jul, 2021
引入可扩展的基于样本的Bayesian推断方法、匹配的超参数选择方法和经典特征归一化方法,以解决线性化神经网络推断中的计算成本限制和先前突出的路径学问题,从而在CIFAR100、Imagenet和高分辨率层析成像重建任务中实现线性化神经网络推断。
Oct, 2022
本研究介绍了一种基于贝叶斯模型选择和拉普拉斯逼近的方法,通过引入下界到边缘似然的线性化拉普拉斯逼近,用于选择深度学习的超参数优化,该方法可以使用随机梯度基于优化,并可以利用神经切向核估计。实验结果表明,该估计器可以显着加速基于梯度的超参数优化。
Jun, 2023
本文重新推导了在线 Laplace 方法,表明它们针对一种在模型选择问题中纠正了模态的 Laplace 证据的变分界。在线 Laplace 方法以及其纠正模态的版本在近乎平稳点上实现最优解,通过应用于UCI回归数据集,优化关键参数并防止过拟合,优于传统的早期停止方法。
Jul, 2023
本研究评估了贝叶斯方法在深度学习中用于不确定性估计的方法,重点关注广泛应用的Laplace近似及其变体。我们的研究发现,传统的拟合Hessian矩阵的方法对于处理超出分布的检测效率产生了负面影响。我们提出了一种不同的观点,认为仅关注优化先验精度可以在超出分布检测中产生更准确的不确定性估计,并保持适度的校准度。此外,我们证明了这种特性与模型的训练阶段无关,而是与其内在性质相关。通过广泛的实验评估,我们证实了我们简化方法在超出分布领域中优于传统方法的优越性。
Dec, 2023
在该研究中,我们提出了一种利用拉普拉斯近似的替代框架,通过使用后验的曲率和网络预测来估计方差,既避免了计算和翻转黑塞矩阵的步骤,又能够在预训练网络中高效地进行。实验证明,相比于精确和近似黑塞矩阵,该方法表现相当,并具有良好的不确定性覆盖范围。
Mar, 2024
本论文介绍了一种将大型神经网络装备上模型的不确定性的方法,并应用了这个方法在ResNet-50和深度图像先验网络上进行了实验。
Apr, 2024
Bayesian深度学习的不一致性引起了越来越多的关注,温度调节或广义后验分布通常提供了解决这个问题的直接有效方法。本研究引入了一个统一的理论框架,将Bayesian不一致性归因于模型规范不当和先验不足,提出了广义Laplace近似方法来获得高质量的后验分布。
May, 2024
我们提出一种基于拉普拉斯近似和高斯过程先验的方法,通过直接在函数空间中施加先验来解决深度网络中整体性误差估计的问题,并通过矩阵自由线性代数的高度可扩展方法获得改进的结果。
Jul, 2024