Mar, 2024

用受控潜在扩散模型修正心脏成像偏差

TL;DR基于心脏磁共振成像的深度学习解决方案在疾病诊断和预后方面的进展受到高度不平衡和有偏训练数据的阻碍。为了解决这个问题,我们提出了一种通过基于敏感属性(如性别、年龄、体重指数和健康状况)生成合成数据来缓解数据集中固有的不平衡问题的方法。我们采用基于去噪扩散概率模型的ControlNet,以从患者元数据组合的文本和从分割掩模中导出的心脏几何形状为条件,使用大群体研究(具体是英国生物库)进行训练。通过使用已建立的定量度量评估生成图像的真实性来评估我们的方法。此外,我们进行了一个下游分类任务,旨在通过模拟生成样本来纠正少数族群中的不平衡问题,从而消除分类器的偏见。我们的实验证明了所提方法在缓解数据集不平衡方面的有效性,例如缺乏年轻患者或正常BMI水平的心力衰竭患者。这项工作代表了采用合成数据开发公平且具有普适性的医学分类模型的重要一步。值得注意的是,我们的所有实验都是使用一块普通消费级GPU进行的,以突出我们在资源受限环境下的可行性。我们的代码可在此 https URL 中获得。