特征预算随机森林

Feb, 2015

Feature-Budgeted Random Forest

Feng Nan, Joseph Wang, Venkatesh Saligrama

TL;DR该研究提出一种新颖的随机森林算法，通过贪心极小最大代价加权不纯度分割，使得生成具有低成本和高强度的树，来实现在特征收购预算下，如何在保证高准确性的同时降低预测时间成本。理论分析表明算法的收购成本接近最优，实验结果在多个基准数据集上优于基准算法。

Abstract

We seek decision rules for prediction-time cost reduction, where complete data is available for training, but during prediction-time, each

发现论文，激发创造

本文提出了一种基于整数规划及组合优化的随机森林修剪算法，以优化特征的成本与准确性，实验结果表明该算法在资源受限情况下表现优于现有算法。

Jun, 2016

通过使用 out-of-bag 样本来提高随机森林的泛化误差表现。对 UCI 数据库中的四个数据集进行的初步实证研究表明，随机森林的规模有所减小，而精度损失不大。

Mar, 2017

该论文提出一种基于贝叶斯优化的多准则优化框架，以平衡 “随机森林” 分类和回归模型的错误率、预测的稳定性和计算成本。作者表示，在实际应用中，通过优化错误率来选择最优参数的方法可能会引入不必要的成本，而使用该框架可得到不同于错误率优化的参数设置。

Jun, 2017

本研究提出了一种基于强化学习和 MC dropout 采样方法的在线成本敏感特征获取方案，该方案可适用于流式学习的场景，测试结果表明该方案能够有效地获取特征并做出准确预测。

Jan, 2019

该论文提出了一种基于成本驱动的约束来训练鲁棒性决策树模型的成本建模方法，在 Twitter 垃圾邮件检测等场景中显示出比现有方法更高的准确性、更低的误报率和更强的成本感知鲁棒性。

Dec, 2019

提出一种基于主动规划神经网络的在线决策树构建方法，利用自适应子模性来选择获取具有最小代价的特征值，通过后验采样算法降低在线预测误差，对各种现实世界中的数据集进行了广泛的实验，并在概念漂移的情况下展示其有效性和灵活性。

May, 2023

本文提出了一种基于权重优化的随机森林算法，通过极小化预测误差和风险来决定基本学习器的权重，实验结果显示该算法在回归问题上的预测精度优于其他算法。

May, 2023

研究了随机森林模型的统计性质，证明其是一致的，适应于稀疏数据，收敛速度只与有效特征的数量有关。

May, 2010

本文研究了背景下的随机优化问题，提出了一种基于森林决策策略的解决方案，通过开发近似分裂准则，我们能够有效降低运行时间，并在性能上接近于每个候选分裂都进行重新优化的森林算法.

Aug, 2020

随机森林是一种通过构建多个随机决策树，通过平均聚合其预测结果的机器学习算法，可应用于广泛的预测问题并且具有较高的精度，同时支持小样本大小，高维特征空间和复杂数据结构的应对，本文在加法回归模型的情况下证明了该算法的一致性，并探究了随机森林如何很好地适应稀疏性。

May, 2014