RRF 包中的 Guided Random Forest
提出了一种改进的 random forests 模型,也称为 guided RRF,用于选择特征的过程中采用了一个普通 random forest 的重要性评分,实验表明该模型在基因数据集上的准确性表现更为稳健。
Sep, 2012
该研究提出了广义随机森林方法,用于基于随机森林进行非参数统计估计,可以用于拟合任何被识别为满足一组局部矩方程的解的感兴趣数量,提出了一种灵活且计算有效的算法以及新的非参数回归,条件平均偏差估计和异质性治疗效应估计方法,通过本研究可用 GRF 软件实现。
Oct, 2016
基于网络导向的随机森林算法在基因表达数据分析中对于疾病模块和通路识别表现出一定的性能。然而,在疾病预测方面,网络导向的随机森林并没有提供比标准随机森林更好的结果;然而,如果疾病基因形成模块且给定网络中的基因与疾病状态独立,则网络导向的随机森林能够更准确地识别它们,但会在使用网络信息时尤其在中心基因上产生虚假的基因选择结果;我们对 TCGA 的两个平衡的微阵列和 RNA-Seq 乳腺癌数据集进行了经验分析,用于对孕激素受体(PR)状态的分类,结果显示网络导向的随机森林能够识别与 PGR 相关的通路中的基因,从而得到更好的基因模块连接。
Aug, 2023
本篇论文针对高维回归或分类框架中预测变量高度相关的情况下的变量选择问题,研究使用随机森林算法的变量选择。论文提供了一种理论研究和模拟实验的方式,证明了使用递归特征排除算法作为排名标准对变量进行选择的高效性,并进行了陆地卫星数据集的测试。
Oct, 2013
本文介绍了图随机特征(GRFs)的机制,并对其进行了理论和实证分析。GRFs 可以用于构建基于图节点定义的多个重要核函数的无偏随机估计器。相比传统的图核函数算法,GRFs 具有显著的计算性能。此外,GRFs 还提供了一种简单的分布式算法以及其改进版本 q-GRFs 来优化 GRFs 的方差,尤其适用于解决具有正对称矩阵的线性方程组。
Apr, 2023
本研究修改了基于随机森林 (Random Forest,RF) 的算法,提出了一种新的基于概率随机森林 (Probabilistic Random Forest,PRF) 的机器学习算法,用于处理带有不确定性的天文数据,能够有效提高分类准确性以及应用于转移学习。
Nov, 2018
本文介绍了一种新的深度概率模型,叫作 “生成森林”,这种模型将随机森林扩展到了生成模型,可以表示整个特征空间上的联合分布,解决了判别模型缺乏处理预测不确定性方法的问题,并且可以测量每个预测的稳健性和检测分布外的样本。
Jul, 2020
本文介绍了一种使用 Reduced Robust Random Cut Forest (RRRCF) 数据结构的新方法来检测数据集是否处于训练分布,该方法在低维和高维数据的实证结果表明可以有效地进行数据分布的推断,而且该模型易于训练,并且不需要进行困难的超参数调整,用例包括测试和验证结果。
Jun, 2022
介绍了一种新的大规模高斯过程的近似方法 —— 高斯过程随机场,在合理精度和计算代价的前提下实现了潜在变量建模和超参数调节,并在合成空间数据和地震事件定位的真实世界应用中展示了其有效性。
Oct, 2015