May, 2022

用组概率加权树求和解释异质数据建模

TL;DR我们提出了一种新方法,名为 G-FIGS ,可以在医疗领域等高风险领域中处理有限的训练数据,同时保持模型的可解释性。该方法使用实例的权重在数据集中有效地汇集不同组,生成简明的基于规则的模型。在一些重要的临床数据集上,与 CART 和 FIGS 唯一相比,G-FIGS 可用于增加特异度,从而提高诊断敏感性,同时维持 FIGS 的规则数量在 16 条以下,且规则与医学领域的专业知识相匹配。