预算引导下的随机森林修剪

Jun, 2016

Pruning Random Forests for Prediction on a Budget

Feng Nan, Joseph Wang, Venkatesh Saligrama

TL;DR本文提出了一种基于整数规划及组合优化的随机森林修剪算法，以优化特征的成本与准确性，实验结果表明该算法在资源受限情况下表现优于现有算法。

Abstract

We propose to prune a random forest (RF) for resource-constrained prediction. We first construct a RF and then prune it to optimize expected feature cost & accuracy. We pose →

random forest pruning integer program combinatorial optimization resource-constrained

发现论文，激发创造

特征预算随机森林

该研究提出一种新颖的随机森林算法，通过贪心极小最大代价加权不纯度分割，使得生成具有低成本和高强度的树，来实现在特征收购预算下，如何在保证高准确性的同时降低预测时间成本。理论分析表明算法的收购成本接近最优，实验结果在多个基准数据集上优于基准算法。

Feb, 2015

通过森林修剪提高随机森林的准确性和可解释性

通过提出两种森林修剪方法，我们的研究旨在实现既有随机森林的准确性又具有决策树的解释性，通过在给定随机森林中找出最佳子森林，再将选定的树组合在一起，实验证明我们的方法在准确性和所使用的树的数量方面优于当前先进的森林修剪方法。

Jan, 2024

随机森林的代价复杂度剪枝

通过使用 out-of-bag 样本来提高随机森林的泛化误差表现。对 UCI 数据库中的四个数据集进行的初步实证研究表明，随机森林的规模有所减小，而精度损失不大。

Mar, 2017

训练的随机森林完全揭示您的数据集

我们介绍了一种基于优化的重建攻击，能够完全或近乎完全重建用于训练随机森林的数据集。我们将重建问题定义为一个组合优化问题，并通过最大似然目标函数来解决。通过广泛的计算研究，我们证明了即使在小规模树集的情况下，使用特征随机化的随机森林也容易被完全重建，这突显了广泛采用的集成方法固有的关键弱点，值得关注和缓解。虽然隐私研究中已经讨论了此类重建攻击的潜在性，但我们的研究提供了明确的实证证据。

Feb, 2024

随机森林模型分析

研究了随机森林模型的统计性质，证明其是一致的，适应于稀疏数据，收敛速度只与有效特征的数量有关。

May, 2010

概率随机森林：一种用于嘈杂数据集的机器学习算法

本研究修改了基于随机森林 (Random Forest，RF) 的算法，提出了一种新的基于概率随机森林 (Probabilistic Random Forest，PRF) 的机器学习算法，用于处理带有不确定性的天文数据，能够有效提高分类准确性以及应用于转移学习。

Nov, 2018

最优加权随机森林

本文提出了一种基于权重优化的随机森林算法，通过极小化预测误差和风险来决定基本学习器的权重，实验结果显示该算法在回归问题上的预测精度优于其他算法。

May, 2023

随机森林贝叶斯事后正则化

提出了基于贝叶斯思想的后处理随机森林正则化方法，旨在提高其在机器学习任务中的泛化性能并取得了令人满意的结果。

Jun, 2023

TREE：树正则化用于高效执行

通过奖励不均匀概率分布来减少决策树路径长度，优化决策树的内存架构感知实现以降低执行时间。

Jun, 2024

随机优化森林

本文研究了背景下的随机优化问题，提出了一种基于森林决策策略的解决方案，通过开发近似分裂准则，我们能够有效降低运行时间，并在性能上接近于每个候选分裂都进行重新优化的森林算法.

Aug, 2020