森林密度估计

Jan, 2010

Forest Density Estimation

Han Liu, Min Xu, Haijie Gu, Anupam Gupta, John Lafferty...

TL;DR本文研究了高维图估计和密度估计问题，并使用基于森林结构无向图模型的一族密度估计器。对于图估计，研究了估计具有限制树大小的森林的问题，并开发了一种近似算法。

Abstract

We study graph estimation and density estimation in high dimensions, using a family of density estimators based on forest structured undirected graphical models. For →

graph estimation density estimation forest structured undirected graphical models kernel density estimates approximation algorithm

发现论文，激发创造

广义随机森林

该研究提出了广义随机森林方法，用于基于随机森林进行非参数统计估计，可以用于拟合任何被识别为满足一组局部矩方程的解的感兴趣数量，提出了一种灵活且计算有效的算法以及新的非参数回归，条件平均偏差估计和异质性治疗效应估计方法，通过本研究可用 GRF 软件实现。

Oct, 2016

快速非参数条件密度估计

通过建立 full density 模型 f (yjx) 而非只有期望值 E (yjx)，条件密度估计广义了回归。本文提出了双核条件密度估计器，并引入了基于双数树的快速算法，用最大似然准则进行带宽选择，从而在处理多变量数据集时取得 380 万倍的加速。

Jun, 2012

高斯（多项式）树的最优估计

我们研究了学习无向高斯树和有向高斯多叉树的最优算法，考虑了分布学习和结构学习两个问题，通过推导出显式的有限样本保证并给出匹配的下界证明两种方法的最优性，同时进行了数值实验以比较各种算法的性能表现。

Feb, 2024

基于密度比估计及半监督学习的贝叶斯优化

本研究提出了利用半监督学习结合基于密度比估计的贝叶斯优化方法，解决在全局解候选人方面监督分类器过于自信的问题。针对 unlabeled point sampling 和 fixed-size pool 场景，对我们的方法和几种基线方法进行了实验结果展示。

May, 2023

聚类树估计与修剪的一致性流程

该论文提出了两种基于密度估计的聚类方法，包括了单链接算法和 $k$- 近邻图算法，并给出了算法的收敛性和一些最坏情况的样本复杂性。论文最后还研究了一种聚类树剪枝的方法，保证去除躁声簇并恢复主要簇的性质。

Jun, 2014

当不确定性成为问题时，使用蒙德里安森林进行大规模回归

本文介绍了在大规模非参数回归设置中将蒙德里安森林扩展到使用新颖的分层高斯先验，从而获得基于原则的不确定性估计，同时保留决策森林的计算优势。通过使用说明性例子、现实世界中的大规模数据集和贝叶斯优化基准，证明了 Mondrian 森林优于近似 GPs 的大规模回归任务，并提供了比基于决策森林的方法更好的校准不确定性评估。

Jun, 2015

对抗性随机森林用于密度估计和生成建模

本文提出了使用无监督随机森林的新型密度估计和数据合成方法。通过交替的生成和区分，树逐渐学习到数据的结构属性。与经典的基于树的替代方案不同，我们的方法提供平滑的（非）条件密度并允许完全合成数据生成。在执行速度平均快大约两个数量级的同时，我们在各种表格数据基准测试上实现了与最先进的概率电路和深度学习模型可比或更好的性能。

May, 2022

极限分类和密度估计的树和表示同时学习

我们提出了一种新颖的算法，可以同时进行输入数据的表示学习和层次预测器的学习，该算法通过优化多向节点划分的平衡和易分离性来实现目标函数，从而实现分类误差的上界和提高准确性，并将算法的变体应用于文本分类和语言建模中。

Oct, 2016

通过稀疏极大似然估计进行模型选择

使用加入 l1-norm 惩罚项的最大似然问题的解决办法来估计高斯或二元分布参数，以得到稀疏的无向图模型，并利用块坐标下降和 Nesterov's 一阶法等算法将复杂度限制在可接受范围内。

Jul, 2007

改善的图聚类

本文提出了一种新算法 —— 最大似然凸化版本，用于解决在随机块模型环境下的社交网络图聚类问题，相较于目前已有算法，本文算法在允许普遍规模的簇大小时的表现高出多项式因子。

Oct, 2012