Feb, 2024

通过离散化和特征选择实现对表格数据的可解释分类器

TL;DR用一种基于布尔分类器生成的方法,从表格数据中计算出既能直接理解,又准确的分类器。通过先将原始数据离散化为布尔形式,然后结合特征选择和一个非常快速的算法来生成最佳的布尔分类器。在 14 个实验中展示了该方法,其结果的准确性主要与随机森林、XGBoost 和文献中相同数据集的现有结果相似。在几种情况下,尽管我们研究的主要目标是分类器的直接可解释性,但我们的方法实际上超越了参考结果的准确性。我们还证明了从现实数据中获取的分类器与数据背景分布下理想的最佳分类器相对应的概率的一个新结果。