隐私保护患者分层的联合非监督随机森林

Jan, 2024

隐私保护患者分层的联合非监督随机森林

Federated unsupervised random forest for privacy-preserving patient stratification

Bastian Pfeifer, Christel Sirocchi, Marcus D. Bloice, Markus Kreuzthaler, Martin Urschler

TL;DR通过无监督随机森林聚类和联合计算，建立了一个强大的框架来推进精准医学，实现有效的患者分层和疾病亚型划分，改进了疾病亚型的解释性，并优化了局部聚类性能。

Abstract

In the realm of precision medicine, effective patient stratification and disease subtyping demand innovative methodologies tailored for multi-omics data. Clustering techniques applied to →

precision medicine patient stratification multi-omics data unsupervised random-forests federated computing

发现论文，激发创造

用于部分重叠临床数据的联邦随机森林

医疗数据的隐私保护、部分重叠特征的处理以及联邦随机森林对临床数据的有效性评估是提升协作性研究和企业合作的有希望的解决方案。

May, 2024

使用联邦生存森林在医疗中扩展生存分析：关于心力衰竭和乳腺癌基因组学的比较研究

在医学领域，生存分析是一种基本工具，用于建模人群中出现感兴趣事件的时间。然而，在现实世界的应用中，生存数据通常是不完整、被审查、分布式和保密的，尤其是在关键性的医疗环境中，隐私保护至关重要。本研究提出了一种名为 FedSurF++ 的 Federated Survival Forest 算法的扩展，这种联邦集成方法在异构联邦中构建随机生存森林。FedSurF++ 相比于现有方法具有可比较的性能，只需要完成一轮通信，通过从客户端森林采样进行了广泛的实证调查，从算法和隐私保护角度来看，显着提高了效率、鲁棒性和隐私性，同时在两个真实数据集上展示了 FedSurF++ 在医疗领域研究中的成功。我们的结果强调了 FedSurF++ 在分布式环境中提高生存分析的可伸缩性和效果的潜力，同时保护用户隐私。

Aug, 2023

脑部肿瘤分割中的集群联邦个性化整脑成像

针对不同机构使用不同扫描仪和获取参数引起的特征漂移问题，我们提出了一种新颖的个性化算法，通过计算每个中心的一系列放射状特征，再进行聚类分析汇总所有传输自本地机构到中央服务器的特征向量，从而优化从经典联合学习获得的全局模型。

Oct, 2023

联邦森林

本文提出了一种称为 Federated Forest 的隐私保护机器学习模型，该模型是传统随机森林方法的无损学习模型，可以在不泄露原始数据的情况下处理分布在不同公司或政府机构中的数据。通过该模型，开发了一种安全的跨地区机器学习系统，并提出了一种新型的预测算法来降低通信开销。实验表明，Federated Forest 的性能已被验证，可以用于实际任务。

May, 2019

利用分布式电子医疗记录进行联邦机器学习预测死亡率和住院时间的患者聚类提高效率

介绍了一种基于社群的联邦机器学习算法，将分布式数据聚类成具有相似诊断和地理位置的有临床意义的社群，使每个社群可以学习一个模型。该算法在现场非 IID ICU EMR 上表现优于传统方法，同时可以保护隐私。

Mar, 2019

隐私保护的个性化联邦学习患者聚类

我们提出了一种隐私保护的基于社区的联邦机器学习 (PCBFL) 框架，通过使用安全的多方计算技术，在保护隐私的情况下利用患者级别数据来聚类患者并训练模型。PCBFL 在低、中、高风险患者的临床上表现出显著改进，并且性能优于传统和现有的聚类型联邦学习框架，平均 AUC 提高 4.3％，AUPRC 提高 7.8％。

Jul, 2023

具有个性化和共享组件混合的医疗联合模型

本文提出了一种新的个性化联邦学习框架来解决异构医疗数据在多个医院之间协作训练神经网络时的降级问题，并设计了差异性稀疏正则化器和降低计算成本的方法来提高计算效率，最后通过实验证明该方法可以获取最佳模型性能和高达 60％的通信效率改进。

Jun, 2023

Orchestra：基于全局一致聚类的无监督联邦学习

本文提出一种基于 Orchestra 算法的无监督联邦学习技术，通过在联邦结构中进行分层聚类任务并强制执行全局一致的客户端数据划分，实现了对统计 / 系统异质性、可扩展性和通信效率的稳健性，保证了良好的泛化性能，并在一系列条件下优于其他技术。

May, 2022

用于可解释无监督树集合的特征图：中心性、交互性及在疾病亚型划分中的应用

在医疗保健等高风险领域中，可以理解模型预测原理同实现高预测准确性一样重要的可解释机器学习已成为利用人工智能的核心。本研究引入了从非监督随机森林构建特征图的新方法和通过这些图派生有效特征组合的特征选择策略，通过在整个数据集和个别聚类上构造特征图，利用树中的父子节点分割，使特征的重要性与聚类任务相关，同时边权重反映特征对的判别能力，从而广泛评估了基于图的特征选择方法在合成和基准数据集上降低维度、改善聚类性能和增强模型可解释性的能力。对于疾病亚类型鉴定的组学数据应用，确定了每个聚类的顶级特征，展示了提出方法在聚类分析中提高解释性和在现实世界的生物医学应用中的实用性。

Apr, 2024

基于转录组数据的联邦学习：模型质量与性能权衡

通过比较实验，我们测试了 TensorFlow Federated 和 Flower 两个联邦学习框架在训练疾病预后和细胞类型分类模型上的性能，验证了这两个框架可以在转录组数据上构建模型，而无需将个人原始数据传输给具有丰富计算资源的第三方。

Feb, 2024