TE2Rules: 从树模型集合中提取规则列表

Jun, 2022

TE2Rules: 从树模型集合中提取规则列表

TE2Rules: Extracting Rule Lists from Tree Ensembles

G Roshan Lal, Xiaotong Chen, Varun Mithal

TL;DR该研究提出一种新方法，将针对二元分类任务训练的 Tree Ensemble 模型转换为规则列表，以增强模型的解释性和可理解性，并在基准数据集上进行了实验。

Abstract

tree ensemble (TE) models (e.g. Gradient Boosted Trees and Random Forests) often provide higher prediction performance compared to single decision trees. However, TE models generally lack transparency and interpretabili

tree ensemble binary classification rule list interpretability te2rules

发现论文，激发创造

通过整数规划从树集合中提取可解释规则的统一方法

从训练的树集成中提取一组优化的规则，提供给用户一个简化、可解释的模型，保留了完整模型的大部分预测能力。

Jun, 2024

学习可解释规则的可扩展数据表示和分类

我们提出了一种新的分类器，命名为基于规则的表示学习器（RRL），它能够自动学习用于数据表示和分类的可解释的非模糊规则，并通过连续空间和梯度移植来优化离散模型，同时设计了逻辑激活函数以提高可扩展性和连续特征离散化。与竞争的可解释方法相比，RRL 在小型和大型数据集上有更好的性能，并且可以根据不同场景的需求方便地调整分类准确性和模型复杂性的权衡。

Oct, 2023

BELLATREX: 基于本地准确规则提取器的解释构建

本文提出了一种新的机器学习解释方法，利用局部准确规则提取器（Bellatrex）从随机森林生成的决策树中预选少量多样化规则，在降低维度、聚类等过程中通过解释少数规则从而解释整个森林预测结果，经 89 组真实数据测试，证实在二分类、回归、多标签分类和预测事件任务中，Bellatrex 方法可以有效、准确地代替随机森林，并在性能上表现优异。

Mar, 2022

用 inTrees 解释树集合

本文提供 inTrees 框架，通过提取、衡量、修剪和选择树集合中的规则，并计算频繁的变量交互来提高树集合的可解释性。inTrees 框架可以应用于分类和回归问题，并适用于多种树集合类型，例如随机森林、正则化随机森林和 Boosted Trees。

Aug, 2014

可扩展的贝叶斯规则列表

提出了一种建立概率规则列表的算法，其速度比以前的工作快两个数量级，并能够通过优化规则列表在准确性、可解释性和计算速度之间实现实用平衡，并利用贝叶斯分层模型优化概率分类器。

Feb, 2016

广义线性规则模型

本文提出使用基于规则的特征（也称为规则集成）的广义线性模型，用于回归和概率分类，通过列生成算法，优化规则集合的复杂度和预测准确性的平衡。在逻辑回归和线性回归的实验中，与现有的规则集成算法相比，所提出的方法可以获得更好的准确性 - 复杂度平衡，一端可以与少量簇比较。

Jun, 2019

从神经网络中提取规则列表的 NN2Rules 方法

本文介绍了一种名为 NN2Rules 的算法，用于将经过训练的神经网络转换成规则列表。通过该方法提取的决策规则与神经元行为类型（如 sigmoid 激活函数或 ReLU 函数）无关，且提取出的规则对任意输入都有与原神经网络相同的预测准确性。

Jul, 2022

基于神经网络的带真值表的规则模型

通过结合基于规则的模型的全局和精确可解释性属性与深度神经网络的高性能，提出了一种名为 Truth Table rules (TT-rules) 的神经网络框架，可将神经网络有效转化为基于规则的模型，并在保持性能和复杂性平衡的同时，实现对大型表格数据集的适配。

Sep, 2023

基于可解释性神经网络的医疗决策规则模型

通过提出神经网络框架 Truth Table rules (TT-rules)，将规则模型的全局和精确可解释性与深度神经网络的高性能相结合，将神经网络转化为基于规则的模型，该模型在医疗应用中表现出与其他可解释方法相当或更高的性能。

Sep, 2023

基于规则集合的预测学习

通过对数据的简单规则的合并构建普通回归和分类模型，生成的规则集在预测准确性方面与最佳方法相当，但其主要优势在于解释和分析相应的输入变量之间的交互作用与影响。技术也被介绍用于自动识别规则中涉及到的变量以及与其相互作用的其他变量等信息，并使用图像来可视化相应数据的效应。

Nov, 2008