用于可解释无监督树集合的特征图：中心性、交互性及在疾病亚型划分中的应用

Apr, 2024

用于可解释无监督树集合的特征图：中心性、交互性及在疾病亚型划分中的应用

Feature graphs for interpretable unsupervised tree ensembles: centrality, interaction, and application in disease subtyping

PDF

Christel Sirocchi, Martin Urschler, Bastian Pfeifer

TL;DR在医疗保健等高风险领域中，可以理解模型预测原理同实现高预测准确性一样重要的可解释机器学习已成为利用人工智能的核心。本研究引入了从非监督随机森林构建特征图的新方法和通过这些图派生有效特征组合的特征选择策略，通过在整个数据集和个别聚类上构造特征图，利用树中的父子节点分割，使特征的重要性与聚类任务相关，同时边权重反映特征对的判别能力，从而广泛评估了基于图的特征选择方法在合成和基准数据集上降低维度、改善聚类性能和增强模型可解释性的能力。对于疾病亚类型鉴定的组学数据应用，确定了每个聚类的顶级特征，展示了提出方法在聚类分析中提高解释性和在现实世界的生物医学应用中的实用性。

Abstract

interpretable machine learning has emerged as central in leveraging artificial intelligence within high-stakes domains such as healthcare, where understanding the rationale behind model predictions is as critical as achieving high predictive accuracy. In this context, →

interpretable machine learning feature selection random forests unsupervised learning clustering

发现论文，激发创造

在聚类价值和可解释性之间平衡权衡

本文提出了一种可解释性的聚类算法，该算法通过优化可解释性，生成具有解释性的聚类，并使用频繁模式挖掘生成简单的说明，该算法适用于具有特征价值的大规模数据集。

Dec, 2019

基于树模型和替代模型的公平特征重要性评分

我们提出了一种公平特征重要性评分，用于解释决策树等可解释的黑盒机器学习模型对公平性或偏见的贡献。通过模拟和真实示例，我们证明了该方法对树形集成和其他机器学习系统的树形替代物提供了有效的解释性。

Oct, 2023

基于图滤波的拓扑特征选择方法

本文介绍了一种基于图形的无监督特征选择技术，该技术利用拓扑受限网络表示的威力，使用和弦图来建模特征之间的依赖结构，通过研究它们在网络内的相对位置来最大化特征相关性的可能性，并在不同应用领域的 16 个基准数据集上测试我们的算法，结果表明我们的算法在异构评估条件下优于或与最新技术水平相匹配。该方法在可调性，可解释性和计算成本方面展现出较高的优越性。

Feb, 2023

利用图数据结构和知识图谱的特征选择策略综述

知识图谱中的特征选择方法论及其在增强机器学习模型有效性、假设生成和解释性方面的作用，强调可扩展性、准确性和可解释性的关键重要性，并倡导结合领域知识来优化选择过程。强调多目标优化和跨学科合作在推进知识图谱特征选择方面的潜力，以及这些方法对精准医疗等领域的变革性影响。同时提出未来的研究方向，包括开发可扩展、动态的特征选择算法，并整合可解释的人工智能原则以提高知识图谱驱动模型的透明度和信任度。

Jun, 2024

不确定图分类的判别特征选择

本文提出了一种新的基于统计学方法的判别子图特征选择算法 DUG，采用了动态规划计算判别分数的概率分布，并提出了一种分支界限搜索算法以高效地找到判别子图特征。在多个神经影像应用程序上广泛实验，结果表明在识别用于图分类的判别子图特征时考虑结构性不确定性对性能提高有显著帮助。

Jan, 2013

使树集成模型可解释性：贝叶斯模型选择方法

本研究提出了一种通过模型简化方法（树模型的选择问题），使得复杂的树模型具有可解释性的算法，该算法可以保证预测性能的同时，将复杂的树模型逼近成最简单的表现形式

Jun, 2016

机器学习算法的解释性方法在乳腺癌诊断中的应用

本研究利用人工智能方法（如随机森林、神经网络和神经网络集成）和可解释性技术（如全局代理，ICE 图和 Shapley 值）进行早期诊断乳腺癌，其中集成神经网络表现最佳，其预测结果经过 ICE 图验证符合当前医学知识，并能进一步用于了解乳腺癌的病理生理机制。

Feb, 2022

基于层次多分辨率特征和先验的图分类

为了将空间（邻域）和双向分层关系以及样本的特征和先验信息纳入他们的分类中，我们针对三种变型的多分辨率邻域图以及分层条件随机场图制定了分类问题。

Jun, 2023

隐私保护患者分层的联合非监督随机森林

通过无监督随机森林聚类和联合计算，建立了一个强大的框架来推进精准医学，实现有效的患者分层和疾病亚型划分，改进了疾病亚型的解释性，并优化了局部聚类性能。

Jan, 2024

通过最优树实现可解释的聚类

本文介绍了一种新的无监督学习算法，利用混合整数优化技术生成可解释的基于树的聚类模型，以提高群集算法的可解释性，并在医疗应用中具有重要意义。

Dec, 2018