线性模型中的多变量重尾推断

NIPSAug, 2010

Inference with Multivariate Heavy-Tails in Linear Models

Danny Bickson, Carlos Guestrin

TL;DR提出了一种基于特征函数的线性特征模型（LCM），利用稳定分布计算在图形模型中存在的重尾分布下的精确和近似推理，该模型不局限于稳定分布，并可适用于离散、连续或混合随机变量。

Abstract

heavy-tailed distributions naturally occur in many real life problems. Unfortunately, it is typically not possible to compute inference in closed-form in →

heavy-tailed distributions graphical models linear characteristic model stable distributions inference

发现论文，激发创造

高维半参数潜在图模型中的混合数据

本文提出了一种名为潜在高斯 Copula 模型的半参数模型，用于建模二元和混合数据的多元统计学习。

Apr, 2014

辅助形式下基于快速梯度的连续潜变量模型推断

通过表达隐变量的辅助形式，增加贝叶斯网络中多层连续隐变量梯度推断和学习的效率，提高混合蒙特卡罗和梯度优化的速度。

Jun, 2013

基于随机傅里叶特征的贝叶斯非线性潜变量建模

提出一种新的方法，用于一般化贝叶斯非线性潜在变量建模，通过使用随机傅里叶特征来逼近高斯过程映射中的核函数，从而将 GPLVM 推广至泊松、负二项和多项分布等情况，并通过随机特征潜变量模型（RFLVM）对广泛的应用进行评估，结果表明该算法在复杂数据集的潜在结构和数据填充方面表现出着与现有先进算法相当的实用性。

Jun, 2023

LMC 多任务高斯过程模型的准确高效解决方案

在本研究中，通过对线性协同关联模型（LMC）进行扩展和参数化，我们证明了只需要对噪声模型做一个温和的假设，即可实现高效的 LMC 的精确计算，从而使其成为目前最先进模型的可靠且简化的替代品，极大地方便了一些计算，如留一法交叉验证和虚构。

Oct, 2023

指数族潜变量模型中精确推理与学习的统一理论

该论文研究了概率图模型中精确实现推断和学习的条件，并开发出相应的算法，通过展示各种示例模型的应用，最终展示了如何将这些模型组合成可处理的概率图模型。

Apr, 2024

关系型连续模型的抬升推理

本文提出新的精确的提升推理算法，用于关系连续模型，能够有效地推断大规模真实应用的模型；该算法处理连续域变量时，改进了传统方法的效率，在高斯概率下算法时间复杂度达到线性级别，并且是第一个通过提升方式处理关系连续模型的精确推理算法；文章通过实验验证表明，该算法性能优于基础推理算法和其他已知的提升方法构建的算法。

Mar, 2012

高维逻辑回归现代极大似然理论

本研究证明在逻辑回归模型中，当样本量和自变量个数的比例变大时，MLE 的偏差和方差均远大于经典预测所得，常用的 LRT 也未能满足卡方分布，因此现有的软件包所得出的推论是不可靠的。

Mar, 2018

概率编程的重尾代数

该研究提出了一种系统性的方法来分析随机变量的尾部，建立了一个基于广义 Gamma 分布的代数，该代数能够在各种操作下区分不同尺度的亚高斯函数，可以直接从定义中重现大部分重要的统计分布，并通过利用重尾代数的推理算法，实现了在多个密度建模及变分推理任务上实现了卓越的性能。

Jun, 2023

高斯混合下的长尾理论

我们提出了一个简单的高斯混合模型用于数据生成，符合 Feldman 的长尾理论（2020）。我们证明了在线性分类器中，在所提出的模型中无法将泛化误差降低到一定水平以下，而具有记忆能力的非线性分类器可以做到。这证实了对于长尾分布，必须考虑到罕见的训练样本才能实现对新数据的最佳泛化。最后，我们展示了在线性和非线性模型之间的性能差距可以在亚种群频率分布的尾部变短时减小，这在合成和实际数据的实验中得到了证实。

Jul, 2023

利用深度潜变量模型的精确似然

本文探讨了深度潜变量模型中精确似然的一般性质及其在实践中的应用，特别是关于参数估计和缺失数据插补。作者介绍了一种基于条件似然的算法，用于深度潜变量模型中的缺失数据插补，并在多个数据集中对比了该算法和通常用于 DLVMs 的插补方案，结果表明该算法显著优于传统方案。作者还探讨了无约束模型似然函数无界的问题及其在模式崩溃中的作用，并提出了确保最大似然估计存在的方法。

Feb, 2018