预算引导下的随机森林修剪
该研究提出一种新颖的随机森林算法,通过贪心极小最大代价加权不纯度分割,使得生成具有低成本和高强度的树,来实现在特征收购预算下,如何在保证高准确性的同时降低预测时间成本。理论分析表明算法的收购成本接近最优,实验结果在多个基准数据集上优于基准算法。
Feb, 2015
通过提出两种森林修剪方法,我们的研究旨在实现既有随机森林的准确性又具有决策树的解释性,通过在给定随机森林中找出最佳子森林,再将选定的树组合在一起,实验证明我们的方法在准确性和所使用的树的数量方面优于当前先进的森林修剪方法。
Jan, 2024
通过使用 out-of-bag 样本来提高随机森林的泛化误差表现。对 UCI 数据库中的四个数据集进行的初步实证研究表明,随机森林的规模有所减小,而精度损失不大。
Mar, 2017
我们介绍了一种基于优化的重建攻击,能够完全或近乎完全重建用于训练随机森林的数据集。我们将重建问题定义为一个组合优化问题,并通过最大似然目标函数来解决。通过广泛的计算研究,我们证明了即使在小规模树集的情况下,使用特征随机化的随机森林也容易被完全重建,这突显了广泛采用的集成方法固有的关键弱点,值得关注和缓解。虽然隐私研究中已经讨论了此类重建攻击的潜在性,但我们的研究提供了明确的实证证据。
Feb, 2024
本研究修改了基于随机森林 (Random Forest,RF) 的算法,提出了一种新的基于概率随机森林 (Probabilistic Random Forest,PRF) 的机器学习算法,用于处理带有不确定性的天文数据,能够有效提高分类准确性以及应用于转移学习。
Nov, 2018
本文研究了背景下的随机优化问题,提出了一种基于森林决策策略的解决方案,通过开发近似分裂准则,我们能够有效降低运行时间,并在性能上接近于每个候选分裂都进行重新优化的森林算法.
Aug, 2020