RRF 包中的 Guided Random Forest

Jun, 2013

Guided Random Forest in the RRF Package

Houtao Deng

TL;DR该论文提出了引导随机森林（GRF）来进行特征选择，GRF 可以独立地构建树并可并行实现，与 GRRF 相比，GRF 选择的特征更多，但分类精度更高，实验证明，在 10 个高维基因数据集上 RF 在特征选择后的应用优于 RF 在所有特征上的应用。

Abstract

random forest (RF) is a powerful supervised learner and has been popularly used in many applications such as bioinformatics. In this work we propose the guided random forest (GRF) for →

random forest guided random forest feature selection supervised learning high-dimensional gene datasets

发现论文，激发创造

带导向正则化随机森林的基因选择

提出了一种改进的 random forests 模型，也称为 guided RRF，用于选择特征的过程中采用了一个普通 random forest 的重要性评分，实验表明该模型在基因数据集上的准确性表现更为稳健。

Sep, 2012

随机森林指南

该论文综述了随机森林算法的理论和方法发展，重点讨论了参数选择、重采样机制和变量重要性测量等数学因素驱动该算法，并强调了其在分类、回归和变量重要性测量等方面的应用。

Nov, 2015

广义随机森林

该研究提出了广义随机森林方法，用于基于随机森林进行非参数统计估计，可以用于拟合任何被识别为满足一组局部矩方程的解的感兴趣数量，提出了一种灵活且计算有效的算法以及新的非参数回归，条件平均偏差估计和异质性治疗效应估计方法，通过本研究可用 GRF 软件实现。

Oct, 2016

网络引导的随机森林用于疾病基因发现的评估

基于网络导向的随机森林算法在基因表达数据分析中对于疾病模块和通路识别表现出一定的性能。然而，在疾病预测方面，网络导向的随机森林并没有提供比标准随机森林更好的结果；然而，如果疾病基因形成模块且给定网络中的基因与疾病状态独立，则网络导向的随机森林能够更准确地识别它们，但会在使用网络信息时尤其在中心基因上产生虚假的基因选择结果；我们对 TCGA 的两个平衡的微阵列和 RNA-Seq 乳腺癌数据集进行了经验分析，用于对孕激素受体（PR）状态的分类，结果显示网络导向的随机森林能够识别与 PGR 相关的通路中的基因，从而得到更好的基因模块连接。

Aug, 2023

随机森林中的相关性和变量重要性

本篇论文针对高维回归或分类框架中预测变量高度相关的情况下的变量选择问题，研究使用随机森林算法的变量选择。论文提供了一种理论研究和模拟实验的方式，证明了使用递归特征排除算法作为排名标准对变量进行选择的高效性，并进行了陆地卫星数据集的测试。

Oct, 2013

用随机特征驯服图核函数

本文介绍了图随机特征（GRFs）的机制，并对其进行了理论和实证分析。GRFs 可以用于构建基于图节点定义的多个重要核函数的无偏随机估计器。相比传统的图核函数算法，GRFs 具有显著的计算性能。此外，GRFs 还提供了一种简单的分布式算法以及其改进版本 q-GRFs 来优化 GRFs 的方差，尤其适用于解决具有正对称矩阵的线性方程组。

Apr, 2023

概率随机森林：一种用于嘈杂数据集的机器学习算法

本研究修改了基于随机森林 (Random Forest，RF) 的算法，提出了一种新的基于概率随机森林 (Probabilistic Random Forest，PRF) 的机器学习算法，用于处理带有不确定性的天文数据，能够有效提高分类准确性以及应用于转移学习。

Nov, 2018

使用深度生成森林进行鲁棒分类

本文介绍了一种新的深度概率模型，叫作 “生成森林”，这种模型将随机森林扩展到了生成模型，可以表示整个特征空间上的联合分布，解决了判别模型缺乏处理预测不确定性方法的问题，并且可以测量每个预测的稳健性和检测分布外的样本。

Jul, 2020

机器学习模型中用于识别分布外数据的减少鲁棒性随机切割森林

本文介绍了一种使用 Reduced Robust Random Cut Forest (RRRCF) 数据结构的新方法来检测数据集是否处于训练分布，该方法在低维和高维数据的实证结果表明可以有效地进行数据分布的推断，而且该模型易于训练，并且不需要进行困难的超参数调整，用例包括测试和验证结果。

Jun, 2022

高斯过程随机场

介绍了一种新的大规模高斯过程的近似方法 —— 高斯过程随机场，在合理精度和计算代价的前提下实现了潜在变量建模和超参数调节，并在合成空间数据和地震事件定位的真实世界应用中展示了其有效性。

Oct, 2015