稳定分布传播的不确定性量化
神经网络的不确定性量化对于评估深度学习系统的可靠性和鲁棒性至关重要。本文提出了一种无样本的矩阵传播技术,通过在网络中传播均值向量和协方差矩阵来准确表征神经网络的输入 - 输出分布。我们的技术的一个关键因素是解析解,用于描述通过非线性激活函数(如 Heaviside、ReLU 和 GELU)传递的随机变量的协方差。在对已训练的神经网络和贝叶斯神经网络的输入 - 输出分布进行分析的实验证明了所提出技术的广泛适用性和优点。
Mar, 2024
本研究提出了两种确定性方法来快速有效地传播高斯分布模型,并研究了相关的不确定因素、校准方法和误差来源之间的关联,从而为解决复杂且真实环境中物体检测与定位的可靠性问题提供了新的解决方案。
Jun, 2023
本文提出了一种基于物理启发式神经网络的深度学习框架,用于量化和传播受非线性微分方程支配的系统中的不确定性。通过建立概率表示,对系统状态进行训练以满足给定的物理定律表达式,并提供了一种有效训练深度生成模型作为物理系统的代理的规范化机制,在这些系统中,数据采集成本高,训练数据集通常较小。该框架提供了一种灵活的方式,用于因输入随机性或观测噪声而导致的物理系统输出不确定性的表征,完全绕过了重复采样昂贵的实验或数值模拟器的需求。作者通过一系列例子证明了方法的有效性,这些例子涉及非线性守恒定律中的不确定性传播以及直接从嘈杂的数据中发现流体通过多孔介质的本构规律。
Nov, 2018
神经网络模型在科学机器学习任务中的应用近年来已大量增加。尤其是,在建模具有时空复杂性的过程方面,神经网络模型表现出色。然而,这些高度参数化的模型在产生与感兴趣的区域保持定量化误差界限方面引起了怀疑。因此,有必要寻找适用于神经网络的不确定性量化方法。本研究对神经网络对复杂时空过程进行了参数不确定性量化的比较,采用了哈密顿蒙特卡洛和 Stein 变分梯度下降及其投影变体。具体而言,我们将这些方法应用于用递归神经网络和神经常微分方程模型建模的发展系统的图卷积神经网络模型。我们展示了 Stein 变分推断是复杂神经网络模型的可行替代方法。对于我们的示例,与哈密顿蒙特卡洛相比,Stein 变分推断在时间上给出了类似的不确定性描述,尽管方差普遍更大。投影 Stein 变分梯度下降也产生了与非投影对应的类似的不确定性描述,但是在神经网络预测的稳定性和复杂的似然函数空间中卷积产生了活动权重空间的大幅减少与困扰。
Feb, 2024
深度神经网络在真实世界中经常面临着分布漂移、各种类型的噪声和概念目标的变化。本文提出了一个适应连续学习数据分布漂移的框架,通过贝叶斯推断中的不确定性量化来缓解灾难性遗忘问题。通过优化一个闭式 ELBO 目标,通过传播分布的前两个矩阵(均值和协方差)来近似预测分布,我们将灾难性遗忘问题降至最低。
Aug, 2023
预测不确定性估计是一个具有挑战性的问题,阻碍了深度神经网络在安全关键应用中作为子系统的使用。我们通过将不确定性传播视为非线性优化问题,采用因子图的方法,观察到在大部分实验中(包括三个数据集和两种神经网络架构),相较于以前的工作,在性能方面取得了显著的提升。我们的实现平衡了采样和分析传播技术的好处,这在实现性能提升方面起到了关键作用。
Dec, 2023
通过级联深度学习模型在医学影像流水线中传播不确定性,我们提出了一种建立可解释的神经网络的不确定性估计方法,并展示了其在重建脑和膝盖磁共振图像以及预测定量信息方面的效用。
Sep, 2023
本研究应用 Bayesian 概率框架和近似推理技术,对神经状态空间模型进行不确定性量化,得出模型输出的可信区间和惊奇指数,以有效诊断模型在潜在危险的分布区域内的使用可能性。
Apr, 2023