提出了基于贝叶斯思想的后处理随机森林正则化方法,旨在提高其在机器学习任务中的泛化性能并取得了令人满意的结果。
Jun, 2023
通过使用 out-of-bag 样本来提高随机森林的泛化误差表现。对 UCI 数据库中的四个数据集进行的初步实证研究表明,随机森林的规模有所减小,而精度损失不大。
Mar, 2017
本文对随机森林进行了深入分析,重点讨论了其学习能力、内部运作和可解释性。本文的贡献在于通过理论分析,证明了随机森林的变量重要性可解释性,从而揭示了随机森林在数据分析和机器学习中的应用潜力。
Jul, 2014
本研究提出了一种通过模型简化方法(树模型的选择问题),使得复杂的树模型具有可解释性的算法,该算法可以保证预测性能的同时,将复杂的树模型逼近成最简单的表现形式
Jun, 2016
该研究提出一种后处理方法通过使用 EM 算法和简化模型来提高树模型的可解释性,并进行了人工合成实验以证明该方法的可行性。
本文提出了一种基于整数规划及组合优化的随机森林修剪算法,以优化特征的成本与准确性,实验结果表明该算法在资源受限情况下表现优于现有算法。
随机森林是一种通过构建多个随机决策树,通过平均聚合其预测结果的机器学习算法,可应用于广泛的预测问题并且具有较高的精度,同时支持小样本大小,高维特征空间和复杂数据结构的应对,本文在加法回归模型的情况下证明了该算法的一致性,并探究了随机森林如何很好地适应稀疏性。
May, 2014
研究了随机森林模型的统计性质,证明其是一致的,适应于稀疏数据,收敛速度只与有效特征的数量有关。
May, 2010
本文提出了一种基于格论的代数方法来解释树集成分类器中随机森林的分类性能,并展示了该方法在提供全局解释方面的能力。
Feb, 2023
本研究提出了一种新的随机回归森林算法,证明了其一致性,并将其与其他理论可追踪的随机森林模型及实践中使用的随机森林算法进行了比较,实验证明了不同简化随机森林模型的方法的重要性。
Oct, 2013