隐私保护患者分层的联合非监督随机森林
在医学领域,生存分析是一种基本工具,用于建模人群中出现感兴趣事件的时间。然而,在现实世界的应用中,生存数据通常是不完整、被审查、分布式和保密的,尤其是在关键性的医疗环境中,隐私保护至关重要。本研究提出了一种名为 FedSurF++ 的 Federated Survival Forest 算法的扩展,这种联邦集成方法在异构联邦中构建随机生存森林。FedSurF++ 相比于现有方法具有可比较的性能,只需要完成一轮通信,通过从客户端森林采样进行了广泛的实证调查,从算法和隐私保护角度来看,显着提高了效率、鲁棒性和隐私性,同时在两个真实数据集上展示了 FedSurF++ 在医疗领域研究中的成功。我们的结果强调了 FedSurF++ 在分布式环境中提高生存分析的可伸缩性和效果的潜力,同时保护用户隐私。
Aug, 2023
针对不同机构使用不同扫描仪和获取参数引起的特征漂移问题,我们提出了一种新颖的个性化算法,通过计算每个中心的一系列放射状特征,再进行聚类分析汇总所有传输自本地机构到中央服务器的特征向量,从而优化从经典联合学习获得的全局模型。
Oct, 2023
本文提出了一种称为 Federated Forest 的隐私保护机器学习模型,该模型是传统随机森林方法的无损学习模型,可以在不泄露原始数据的情况下处理分布在不同公司或政府机构中的数据。 通过该模型,开发了一种安全的跨地区机器学习系统,并提出了一种新型的预测算法来降低通信开销。 实验表明,Federated Forest 的性能已被验证,可以用于实际任务。
May, 2019
介绍了一种基于社群的联邦机器学习算法,将分布式数据聚类成具有相似诊断和地理位置的有临床意义的社群,使每个社群可以学习一个模型。该算法在现场非 IID ICU EMR 上表现优于传统方法,同时可以保护隐私。
Mar, 2019
我们提出了一种隐私保护的基于社区的联邦机器学习 (PCBFL) 框架,通过使用安全的多方计算技术,在保护隐私的情况下利用患者级别数据来聚类患者并训练模型。PCBFL 在低、中、高风险患者的临床上表现出显著改进,并且性能优于传统和现有的聚类型联邦学习框架,平均 AUC 提高 4.3%,AUPRC 提高 7.8%。
Jul, 2023
本文提出了一种新的个性化联邦学习框架来解决异构医疗数据在多个医院之间协作训练神经网络时的降级问题,并设计了差异性稀疏正则化器和降低计算成本的方法来提高计算效率,最后通过实验证明该方法可以获取最佳模型性能和高达 60%的通信效率改进。
Jun, 2023
本文提出一种基于 Orchestra 算法的无监督联邦学习技术,通过在联邦结构中进行分层聚类任务并强制执行全局一致的客户端数据划分,实现了对统计 / 系统异质性、可扩展性和通信效率的稳健性,保证了良好的泛化性能,并在一系列条件下优于其他技术。
May, 2022
在医疗保健等高风险领域中,可以理解模型预测原理同实现高预测准确性一样重要的可解释机器学习已成为利用人工智能的核心。本研究引入了从非监督随机森林构建特征图的新方法和通过这些图派生有效特征组合的特征选择策略,通过在整个数据集和个别聚类上构造特征图,利用树中的父子节点分割,使特征的重要性与聚类任务相关,同时边权重反映特征对的判别能力,从而广泛评估了基于图的特征选择方法在合成和基准数据集上降低维度、改善聚类性能和增强模型可解释性的能力。对于疾病亚类型鉴定的组学数据应用,确定了每个聚类的顶级特征,展示了提出方法在聚类分析中提高解释性和在现实世界的生物医学应用中的实用性。
Apr, 2024
通过比较实验,我们测试了 TensorFlow Federated 和 Flower 两个联邦学习框架在训练疾病预后和细胞类型分类模型上的性能,验证了这两个框架可以在转录组数据上构建模型,而无需将个人原始数据传输给具有丰富计算资源的第三方。
Feb, 2024