Apr, 2024

用于可解释无监督树集合的特征图:中心性、交互性及在疾病亚型划分中的应用

TL;DR在医疗保健等高风险领域中,可以理解模型预测原理同实现高预测准确性一样重要的可解释机器学习已成为利用人工智能的核心。本研究引入了从非监督随机森林构建特征图的新方法和通过这些图派生有效特征组合的特征选择策略,通过在整个数据集和个别聚类上构造特征图,利用树中的父子节点分割,使特征的重要性与聚类任务相关,同时边权重反映特征对的判别能力,从而广泛评估了基于图的特征选择方法在合成和基准数据集上降低维度、改善聚类性能和增强模型可解释性的能力。对于疾病亚类型鉴定的组学数据应用,确定了每个聚类的顶级特征,展示了提出方法在聚类分析中提高解释性和在现实世界的生物医学应用中的实用性。