通过森林修剪提高随机森林的准确性和可解释性

Jan, 2024

通过森林修剪提高随机森林的准确性和可解释性

Improving the Accuracy and Interpretability of Random Forests via Forest Pruning

Albert Dorador

TL;DR通过提出两种森林修剪方法，我们的研究旨在实现既有随机森林的准确性又具有决策树的解释性，通过在给定随机森林中找出最佳子森林，再将选定的树组合在一起，实验证明我们的方法在准确性和所使用的树的数量方面优于当前先进的森林修剪方法。

Abstract

Decades after their inception, random forests continue to provide state-of-the-art accuracy in a variety of learning problems, outperforming in this respect alternative machine learning algorithms such as decisio

random forests interpretability ensemble method forest pruning methods accuracy

发现论文，激发创造

随机森林贝叶斯事后正则化

提出了基于贝叶斯思想的后处理随机森林正则化方法，旨在提高其在机器学习任务中的泛化性能并取得了令人满意的结果。

Jun, 2023

随机森林的代价复杂度剪枝

通过使用 out-of-bag 样本来提高随机森林的泛化误差表现。对 UCI 数据库中的四个数据集进行的初步实证研究表明，随机森林的规模有所减小，而精度损失不大。

Mar, 2017

理解随机森林：从理论到实践

本文对随机森林进行了深入分析，重点讨论了其学习能力、内部运作和可解释性。本文的贡献在于通过理论分析，证明了随机森林的变量重要性可解释性，从而揭示了随机森林在数据分析和机器学习中的应用潜力。

Jul, 2014

使树集成模型可解释性：贝叶斯模型选择方法

本研究提出了一种通过模型简化方法（树模型的选择问题），使得复杂的树模型具有可解释性的算法，该算法可以保证预测性能的同时，将复杂的树模型逼近成最简单的表现形式

Jun, 2016

树形集成模型的可解释性

该研究提出一种后处理方法通过使用 EM 算法和简化模型来提高树模型的可解释性，并进行了人工合成实验以证明该方法的可行性。

Jun, 2016

预算引导下的随机森林修剪

本文提出了一种基于整数规划及组合优化的随机森林修剪算法，以优化特征的成本与准确性，实验结果表明该算法在资源受限情况下表现优于现有算法。

Jun, 2016

随机森林的一致性

随机森林是一种通过构建多个随机决策树，通过平均聚合其预测结果的机器学习算法，可应用于广泛的预测问题并且具有较高的精度，同时支持小样本大小，高维特征空间和复杂数据结构的应对，本文在加法回归模型的情况下证明了该算法的一致性，并探究了随机森林如何很好地适应稀疏性。

May, 2014

随机森林模型分析

研究了随机森林模型的统计性质，证明其是一致的，适应于稀疏数据，收敛速度只与有效特征的数量有关。

May, 2010

树集成分类器的概念视角

本文提出了一种基于格论的代数方法来解释树集成分类器中随机森林的分类性能，并展示了该方法在提供全局解释方面的能力。

Feb, 2023

缩小差距：随机森林的理论与实践

本研究提出了一种新的随机回归森林算法，证明了其一致性，并将其与其他理论可追踪的随机森林模型及实践中使用的随机森林算法进行了比较，实验证明了不同简化随机森林模型的方法的重要性。

Oct, 2013