具备领域知识先验的贝叶斯神经网络
本研究提出了将不同类型的知识约束作为后验正则化项,结合增广 Lagrangian 方法和现有的 BNN 求解器进行有效推理,进而改进传统 BNN 模型的性能,并通过模拟实验以及航空着陆预测和太阳能输出预测等两个案例表明新模型的性能提高。
Oct, 2022
本文提出了一种将先验知识通过外部摘要信息纳入贝叶斯神经网络中的简单方法,通过引入 Dirichlet 过程并推导相应的总结证据下限,将可用的摘要信息作为增广数据建模。使用本方法可以增强模型对分类任务难度和类别分布的了解,并在准确性、不确定性校准和对数据损坏的鲁棒性等方面表现良好。
Jul, 2022
本研究提出了 BNNpriors 库,可以应用于贝叶斯神经网络,并且具有各种先验分布,包括重尾、层次结构和混合先验,以及模块化方法,易于设计实施自定义先验。通过在贝叶斯神经网络中发现冷后效应的本质,这将有助于未来的研究和实际应用。
May, 2021
神经网络在各个问题领域取得了显著的表现,但其普适性受到其内在限制的阻碍,如预测上的过度自信、解释能力的欠缺和对对抗攻击的易受攻击性等。为了解决这些挑战,贝叶斯神经网络(BNNs)已成为传统神经网络的引人注目的扩展,在预测能力中整合了不确定性估计。本文系统地介绍了神经网络和贝叶斯推理的基本概念,阐明了它们对 BNNs 的协同集成的发展。目标受众包括具有贝叶斯方法背景但缺乏深度学习专业知识的统计学家,以及具有有限贝叶斯统计知识但精通深度神经网络的机器学习专家。我们概述了常用的先验知识,分析了它们对模型行为和性能的影响。此外,我们还深入探讨了在 BNN 研究领域内的先进主题,承认了不断进行的辩论和争议。通过提供对前沿发展的深入洞察,本文不仅为研究人员和实践者提供了 BNNs 方面的坚实基础,还展示了该动态领域的潜在应用。作为宝贵的资源,它促进对 BNNs 及其前景的理解,推动知识和创新的进一步发展。
Sep, 2023
本文提出了一种基于概率框架和可分变贝叶斯推理的方法,将不确定性引入神经网络权重来处理由于目标域数据不可访问引起的域移位和不确定性挑战。实验结果表明,该方法在四个广泛使用的交叉域视觉识别基准测试中始终提供最先进的平均准确性。
May, 2021
使用贝叶斯方法进行深度神经网络(BNNs)训练在广泛应用中受到了极大关注,并且已被有效地应用于各种情况。然而,大多数关于对 BNNs 的后验集中性质的研究仅在具有稀疏或重尾先验的 BNN 模型中证明结果。令人惊讶的是,目前还没有关于使用最常用的高斯先验进行 BNNs 的理论结果存在。这种理论缺乏是由于没有非稀疏且具有有界参数的深度神经网络(DNNs)的近似结果。在本文中,我们提出了一个新的近似理论,用于具有有界参数的非稀疏 DNNs。此外,基于该近似理论,我们表明具有非稀疏一般先验的 BNNs 可以以接近最小最优后验集中速率接近真实模型。
Mar, 2024
本文为解决 Bayesian 深度学习中的先验分布选择困难性问题,提出了一种基于 Gaussian processes 的新颖的功能先验分布匹配框架,该框架可通过 Markov chain Monte Carlo 方法进行可扩展的先验分布采样,从而显著提高了性能。
Nov, 2020
本研究提出两种创新方法以将变分贝叶斯转化为贝叶斯神经网络的稳健推理工具:一种新的确定性方法用于逼近神经网络的矩,消除了梯度方差;一种参数的分层先验和自动选择先验方差的新的经验贝叶斯程序。将这两种方法结合起来,所得到的方法高效而稳健,在异方差回归应用中表现出了很好的预测性能。
Oct, 2018
本研究旨在利用模型不确定性作为 BNN 结构学习的框架,提出了可与模型空间约束结合的可扩展变分推理方法,试图在模型和参数的联合空间中进行推理,进而实现结构和参数不确定性的组合,并在基准数据集上进行了实验,表明使方法比普通 Bayesian neural networks 更加稀疏,但得到了与竞争模型相当的精度结果。
May, 2023