稀疏深度学习的高效变分推断及理论保证
本研究使用贝叶斯压缩感知框架从概率学的角度研究了重尾先验下的线性模型,并借助基于随机场的 Perturb-and-MAP 算法提出了一种高效的方法近似估计高斯方差,实现对完整后验分布的捕捉及模型参数的学习并通过实验在图像去模糊中得到了良好效果。
Jul, 2011
本文介绍了一种使用概率分布的随机矩阵来管理参数的变分贝叶斯神经网络,并使用矩阵变量高斯参数后验分布来明确建模每个层的输入和输出维度之间的协方差。此外,使用近似协方差矩阵,可以实现比完全分解更高效且更便宜的表示,同时无需损失模型性能。通过引入“局部重参数化技巧”,可以将此后验分布转换为高斯过程,从而为每个层的隐藏单元提供解释,与深度高斯过程建立联系,并结合伪数据提高了模型采样效率。实验表明所提出的方法的有效性。
Mar, 2016
本研究提出两种创新方法以将变分贝叶斯转化为贝叶斯神经网络的稳健推理工具:一种新的确定性方法用于逼近神经网络的矩,消除了梯度方差;一种参数的分层先验和自动选择先验方差的新的经验贝叶斯程序。将这两种方法结合起来,所得到的方法高效而稳健,在异方差回归应用中表现出了很好的预测性能。
Oct, 2018
本文提出了一种基于贝叶斯线性模型的新型逐层初始化策略,用于解决随机变分推断的初始化问题,并在回归、分类等任务中进行了广泛验证,与启发式初始化相比,能够实现更快更好的收敛。
Oct, 2018
本文提出一种新方法进行稀疏编码,在学习稀疏分布时通过截断样本避免使用有问题的松弛方法。通过在Fashion MNIST和CelebA数据集上与标准变分自编码器进行比较,证明了该方法具有更优越的性能、统计效率和梯度估计。
May, 2022
本研究旨在利用模型不确定性作为 BNN 结构学习的框架,提出了可与模型空间约束结合的可扩展变分推理方法,试图在模型和参数的联合空间中进行推理,进而实现结构和参数不确定性的组合,并在基准数据集上进行了实验,表明使方法比普通 Bayesian neural networks 更加稀疏,但得到了与竞争模型相当的精度结果。
May, 2023
基于市场下行底部的趋势,通过计算国内主要增量资金、流动性、情绪、技术指标等多因素,进行权重计算,提出了基于隐藏半马尔科夫模型的股票量化分析方法。
Aug, 2023
稀疏子空间变分推理(SSVI)是一种全稀疏贝叶斯神经网络(BNN)框架,它通过从随机初始化的低维稀疏子空间开始,交替优化稀疏子空间基选择和相关参数,实现了在训练和推理阶段一致高稀疏性的BNN模型。
Feb, 2024
我们在贝叶斯框架中考虑深度神经网络,采用随机网络权重的先验分布。根据 Agapiou 和 Castillo(2023)的最新观点表明,重尾先验分布实现了对平滑性的自适应,我们提出了一个简单的基于重尾权重和ReLU激活的贝叶斯深度学习先验。我们证明了相应的后验分布在非参数回归、几何数据和Besov空间等多种情况下实现了近乎最优的极小极小收缩率,同时对底层函数的内在维度和平滑性进行了自适应。虽然迄今为止大多数方法需要在先验分布中内置一种模型选择的形式,我们方法的一个关键方面是它不需要对网络架构进行超参数采样学习。我们还提供了结果的变分贝叶斯对应物,表明均场变分近似仍然从近乎最优的理论支持中受益。
Jun, 2024