贝叶斯分类器中连续分布的估计

Feb, 2013

Estimating Continuous Distributions in Bayesian Classifiers

George H. John, Pat Langley

TL;DR本文研究了贝叶斯网络概率分布的建模问题，比较了两种密度估计方法，结论表明核估计是学习贝叶斯模型的有用工具。

Abstract

When modeling a probability distribution with a bayesian network, we are faced with the problem of how to handle continuous variables. Most previous work has either solved the problem by discretizing, or assumed

bayesian network continuous variables nonparametric density estimation naive bayesian classifier kernel density estimation

发现论文，激发创造

快速非参数条件密度估计

通过建立 full density 模型 f (yjx) 而非只有期望值 E (yjx)，条件密度估计广义了回归。本文提出了双核条件密度估计器，并引入了基于双数树的快速算法，用最大似然准则进行带宽选择，从而在处理多变量数据集时取得 380 万倍的加速。

Jun, 2012

基于贝叶斯归一化流的条件密度估计

本文提出使用正规化流作为灵活的似然模型，以及提出了一种有效的方法来适应复杂分布的条件密度估计问题，其使用贝叶斯框架对这些条件密度估计器进行先驱概率分析，最终将该方法应用于两大数据集的空间密度建模任务上，并在某些情况下获得了最先进的性能。

Feb, 2018

高斯网路学习

该研究文章探讨了如何从用户知识和统计数据中学习贝叶斯网络，提出了一种得分度量和搜索程序，并通过从单个先验贝叶斯网络构建先验概率分布，识别出两个重要的假设（事件等价性和参数模块化），为连续变量或离散和连续变量混合的领域开发分数度量方法。

Feb, 2013

高维数据的非参数密度估计 - 算法与应用

本文介紹了一些新的高維度非參數密度估計算法，探討其在無監督學習中的應用，特別是聚類問題，並且提出了一些和高維數據分析相關的研究方向。

Mar, 2019

基于贝叶斯非参数的 k-means 聚类新算法再探

本文从贝叶斯非参数的角度出发，重新审视了 k-means 聚类算法。通过分析 Dirichlet 过程混合物的 Gibbs 抽样算法，我们发现这个算法在极限下接近于硬聚类算法，可以优雅且单调地最小化一个类似 k-means 的聚类目标，包括对聚类数的惩罚。我们将这个方法推广到了多个数据集的聚类情况，并讨论了进一步的扩展，包括门槛特征向量的光谱松弛和在图中不需要固定聚类数的归一化割图聚类算法。

Nov, 2011

通过非参数散度估计在样本集上的核函数

该论文提出了一种基于核函数的机器学习算法，可以通过对数据集的分组进行处理，采用独立同分布的样本集作为数据点，利用非参数估计器提取核函数特征从而实现多种分类、回归和异常检测等任务。

Feb, 2012

非参数变分推断

本文提出了一种基于非参数核密度估计的变分逼近方法，通过优化内核位置和带宽参数最大化数据边际似然下限，不同于其他变分逼近方法，本方法能够捕捉后验分布的多个模式，并成功应用于各种图模型和非线性矩阵分解模型中，预测性能优于更专业化的变分方法和基于样本的逼近方法。

Jun, 2012

具有连续处理的双无偏机器学习非参数推断

本文提出了一种基于双无偏机器学习 (DML) 的非参数推断方法，用于连续治疗变量的因果效应估计，同时解决了无遗漏条件和非参数 / 高维麻烦参数的问题，并通过利用基于核的双重稳健矩函数和交叉拟合提供了高级条件，以实现估计的无偏性。

Apr, 2020

学习贝叶斯网络：离散和高斯领域的统一

研究贝叶斯方法学习来自先前知识和统计数据的贝叶斯网络。通过使用 Dirichlet 和正态 - 威夏特分布的统计事实，结合贝叶斯评分度量，我们实现了对离散和高斯域的统一方法。

Feb, 2013

一种用于条件概率密度的神经贝叶斯估计器

本文介绍了一种基于神经网络和贝叶斯诠释的非参数光滑回归算法来估计条件概率密度函数 f (t | x)，可应用于如最大似然拟合或预测任务等各种场景，并针对非高斯分布进行了自动处理。

Feb, 2004