线性模型中的多变量重尾推断
提出一种新的方法,用于一般化贝叶斯非线性潜在变量建模,通过使用随机傅里叶特征来逼近高斯过程映射中的核函数,从而将 GPLVM 推广至泊松、负二项和多项分布等情况,并通过随机特征潜变量模型(RFLVM)对广泛的应用进行评估,结果表明该算法在复杂数据集的潜在结构和数据填充方面表现出着与现有先进算法相当的实用性。
Jun, 2023
在本研究中,通过对线性协同关联模型(LMC)进行扩展和参数化,我们证明了只需要对噪声模型做一个温和的假设,即可实现高效的 LMC 的精确计算,从而使其成为目前最先进模型的可靠且简化的替代品,极大地方便了一些计算,如留一法交叉验证和虚构。
Oct, 2023
该论文研究了概率图模型中精确实现推断和学习的条件,并开发出相应的算法,通过展示各种示例模型的应用,最终展示了如何将这些模型组合成可处理的概率图模型。
Apr, 2024
本文提出新的精确的提升推理算法,用于关系连续模型,能够有效地推断大规模真实应用的模型;该算法处理连续域变量时,改进了传统方法的效率,在高斯概率下算法时间复杂度达到线性级别,并且是第一个通过提升方式处理关系连续模型的精确推理算法;文章通过实验验证表明,该算法性能优于基础推理算法和其他已知的提升方法构建的算法。
Mar, 2012
本研究证明在逻辑回归模型中,当样本量和自变量个数的比例变大时,MLE 的偏差和方差均远大于经典预测所得,常用的 LRT 也未能满足卡方分布,因此现有的软件包所得出的推论是不可靠的。
Mar, 2018
该研究提出了一种系统性的方法来分析随机变量的尾部,建立了一个基于广义 Gamma 分布的代数,该代数能够在各种操作下区分不同尺度的亚高斯函数,可以直接从定义中重现大部分重要的统计分布,并通过利用重尾代数的推理算法,实现了在多个密度建模及变分推理任务上实现了卓越的性能。
Jun, 2023
我们提出了一个简单的高斯混合模型用于数据生成,符合 Feldman 的长尾理论(2020)。我们证明了在线性分类器中,在所提出的模型中无法将泛化误差降低到一定水平以下,而具有记忆能力的非线性分类器可以做到。这证实了对于长尾分布,必须考虑到罕见的训练样本才能实现对新数据的最佳泛化。最后,我们展示了在线性和非线性模型之间的性能差距可以在亚种群频率分布的尾部变短时减小,这在合成和实际数据的实验中得到了证实。
Jul, 2023
本文探讨了深度潜变量模型中精确似然的一般性质及其在实践中的应用,特别是关于参数估计和缺失数据插补。作者介绍了一种基于条件似然的算法,用于深度潜变量模型中的缺失数据插补,并在多个数据集中对比了该算法和通常用于 DLVMs 的插补方案,结果表明该算法显著优于传统方案。作者还探讨了无约束模型似然函数无界的问题及其在模式崩溃中的作用,并提出了确保最大似然估计存在的方法。
Feb, 2018