通过离散化和特征选择实现对表格数据的可解释分类器

Feb, 2024

通过离散化和特征选择实现对表格数据的可解释分类器

Interpretable classifiers for tabular data via discretization and feature selection

Reijo Jaakkola, Tomi Janhunen, Antti Kuusisto, Masood Feyzbakhsh Rankooh, Miikka Vilander

TL;DR用一种基于布尔分类器生成的方法，从表格数据中计算出既能直接理解，又准确的分类器。通过先将原始数据离散化为布尔形式，然后结合特征选择和一个非常快速的算法来生成最佳的布尔分类器。在 14 个实验中展示了该方法，其结果的准确性主要与随机森林、XGBoost 和文献中相同数据集的现有结果相似。在几种情况下，尽管我们研究的主要目标是分类器的直接可解释性，但我们的方法实际上超越了参考结果的准确性。我们还证明了从现实数据中获取的分类器与数据背景分布下理想的最佳分类器相对应的概率的一个新结果。

Abstract

We introduce a method for computing immediately human interpretable yet accurate classifiers from tabular data. The classifiers obtained a

classifiers tabular data dnf-formulas feature selection interpretability

发现论文，激发创造

通过带有动态命题的布尔公式实现全球可解释的分类器

提出一种从表格数据中提取可立即解释的人类可理解分类器的方法，并使用 Answer Set Programming 实现，其优点是分类器长度短且容易理解，与参考方法相比准确度相近。

Jun, 2024

布朗运算分类器的计算智能性

本文研究了布尔分类器的计算可懂性，证明了在解释查询和验证查询方面，决策树与其他分类器存在明显的可懂性差距。

Apr, 2021

DNF-Net: 一种用于表格数据的神经结构

本文介绍了一种新颖的通用神经网络结构 DN F-Net，其归纳偏差促使其结构对应于包含于仿射软阈值决策项上的逻辑布尔公式的析取范式（DNF）。我们的实验证明，相对于全连接结构，在表格数据上，DNF-Net 取得了显著而一致的性能提升，证明了其在神经网络中实现端到端的表格数据处理的潜在用处。

Jun, 2020

运用表达性布尔公式的可解释人工智能

本研究提出并实现了一种基于表达式布尔公式的可解释人工智能分类模型，适用于信用评分和医学诊断等领域，该分类器使用原生本地优化技术进行训练。

Jun, 2023

解释性线性分类的方法和模型

提出了一种基于整数规划的框架，用于构建准确且可解释的离散线性分类模型，该框架具有控制和灵活性，可为特定领域的实践者量身定制准确且可解释的模型。通过数值实验和睡眠呼吸暂停诊断工具的案例研究，展示了该框架的性能和灵活性。

May, 2014

可解释的二级布尔规则学习分类

本文提出了一种新的优化框架，用于学习准确且精简的两级布尔规则，通过线性规划松弛，块坐标下降和交替最小化等高效算法来更新优化函数，以实现准确性和可解释性之间的平衡。实验表明，我们的方法在准确性和可解释性之间提供了很好的权衡。

Jun, 2016

综合翻译聚焦特征解释：从表格数据中获取预测信号

通过对注意力机制进行研究并将其建模为从 Gumbel-Softmax 分布中采样的潜在变量，我们提出了 InterpreTabNet，该模型通过 KL 散度正则化实现了注意力掩码中不同概念的学习，从而改善了预测结果的解释性和预测关键要素的确定性，并结合大型语言模型和提示工程方法来帮助解释我们模型中特征之间的相互依赖关系。在真实数据集上的综合实验表明，InterpreTabNet 在解释表格数据方面优于先前的方法，并同时保持了较高的准确性。

Jun, 2024

生成森林

本研究论文介绍了一种用于密度建模和表格数据生成的基于树的生成模型，该模型提高了最新提案的建模能力，并提出了一种简化先前方法训练设置并显示提升一致性收敛性的训练算法。通过实验验证了我们方法在缺失数据插补和生成数据与真实数据对比方面的优质结果。

Aug, 2023

可解释的二级布尔规则学习用于分类

本文提出以布尔规则为基础的分类方法，并通过基于整数规划和 Hamming 距离的算法，寻求简单分类规则和分类准确性之间的平衡，实现优于一级规则的分类效果。

Nov, 2015

从神经网络中学习准确且可解释的决策规则集

本文提出了一种新的范式，使用一个可解释的二层神经网络学习一组独立的逻辑规则作为分类的模型，并提出一种基于稀疏性的规则得出算法，相比其他学习算法和黑匣子模型，该方法可以在分类准确性和简单性之间取得更好的平衡。

Mar, 2021