多样、筛选的临床图像集上皮肤科AI性能的差异
本研究关注如何在不同皮肤颜色的情况下,训练深度神经网络模型对临床皮肤病例进行分类,发现由 Fitzpatrick 皮肤类型标签进行数据注释所训练的深度神经网络模型对相似肤色的图像分类的准确度更高,并通过对比人工标记的 Fitzpatrick 皮肤类型标签和算法判定的肤色类型来进一步评价该深度神经网络模型。
Apr, 2021
该篇论文通过使用 EdgeMixup 数据预处理算法实现了对深度学习模型在诊断皮肤病方面存在的模型偏差进行纠正,并对 Lyme,Tinea Corporis 和 Herpes Zoster 等病变诊断模型的性能进行了比较和分析,其中 EdgeMixup 在减少光之间和暗之间皮肤样本分类准确率差距方面显示出显著的表现优势。
Feb, 2022
通过在皮肤病分类图像中考虑皮肤色调差异来解决公平性问题是至关重要的,然而公共数据集中缺乏皮肤色调标签导致无法构建公平的分类器。目前,这些皮肤色调标签的估计是在独立研究中使用个体类型角度(ITA)进行公正性分析之前进行的。本文回顾并比较了四种基于ITA的皮肤色调分类方法在ISIC18数据集上的应用,该数据集是评估皮肤癌分类公平性的常用基准。我们的分析揭示了先前发表的研究中存在较大分歧,从而展示了基于ITA的皮肤色调估计方法存在的风险。此外,我们调查了这些方法之间差异如此之大的原因,并发现ISIC18数据集中缺乏多样性,限制了其作为公平性分析测试平台的使用。最后,我们建议进一步研究鲁棒的ITA估计方法和带有肤色注释的多样性数据集采集,以促进对皮肤科人工智能工具的公平评估。我们的代码可在此https URL访问。
Aug, 2023
通过图像分析开发深度学习模型诊断皮肤病变的激增值得注意,然而它们在临床黑脸挑战方面存在限制:限定的诊断输出数量、对罕见皮肤病变缺乏实际世界测试、无法检测越界图像以及过度依赖显微镜图像。为了解决这些问题,我们提出了一种全能的HOT模型(Hierarchical-Out of Distribution-Clinical Triage),对于临床图像,我们的模型生成三个输出:层次预测、越界图像警报以及在临床图像不足以进行诊断时对显微镜图像的推荐。当进行推荐时,它将同时整合临床和显微镜图像以进行最终诊断。针对代表性的皮肤病变数据集进行的大量实验证明了我们框架内每个组件的有效性和协同作用。我们多功能的模型为病变诊断提供有价值的决策支持,并为医学AI应用设定了一个有前景的先例。
Nov, 2023
通过研究肤色对皮肤疾病检测性能的影响以及肤色差异与病变区域之间的色差对恶性检测的作用,我们提出了一种量化色差分数的方法并应用于多种皮肤疾病数据集。观察到高和低色差差异组之间的性能差距,这一差异在各种图像分类模型中一致存在,从而验证了我们的假设。此外,我们还研究了肤色和色差效应之间的相互作用,并提出色差可能是肤色性能偏差的另一个原因。我们的工作为改善皮肤疾病检测提供了一个补充角度。
Jan, 2024
近期,人工智能算法在从临床照片中分类皮肤病方面取得了巨大进展。然而,我们对这些算法在现实环境下的鲁棒性了解甚少,而很多因素可能导致其普适性的丧失。通过理解和克服这些限制,我们可以开发出可以帮助在各种临床环境下诊断皮肤病的具有普适性的人工智能。在这项回顾性研究中,我们证明皮肤病分布的差异是人工智能算法在对来自先前未知来源的数据进行评估时产生错误的主要原因,与人口统计或图像捕捉模式无关。我们展示了一系列步骤来弥合这种普适性差距,需要越来越多关于新数据源的信息,从病症分布到以在训练期间较少接触到的数据为重点的训练数据。我们的研究结果还表明,与仅冻结嵌入模型的分类层进行微调相比,端到端微调的性能相当。根据所掌握的信息和资源,我们的方法可以为人工智能算法在新环境中的应用提供指导。
Feb, 2024
本研究针对皮肤病诊断中不同肤色间的信息差距问题,提出了一种结合迁移学习和领域适应的新方法。通过利用多种来源的预训练模型,并在多样皮肤影像数据集上进行评估,研究显示该方法能够有效提升皮肤疾病预测的准确性和包容性,特别是对暗肤色皮肤病的表现。主要发现是,Med-ViT模型表现最佳,展现了更全面的特征表示能力。
Sep, 2024
本研究旨在评估两种深度学习模型在皮肤癌检测中的可靠性,特别关注它们的可解释性和公平性。研究发现,尽管模型在大部分皮肤病变类型中表现良好,但在光照皮肤和深色皮肤之间的假阳性和假阴性率上存在显著差异,提出的后处理策略有效改善了公平性,强调了对AI医疗模型在不同人群中进行严格评估的必要性。
Sep, 2024
本研究探讨了现有皮肤癌图像数据集中存在的色调不平衡问题,这导致机器学习模型在不同肤色检测皮肤癌时表现不均。通过比较不平衡和平衡数据集得到的模型,发现无论数据集的平衡与否,模型对肤色的偏见均显著存在,表明现有模型需寻求新方法以减少偏见,实现更公正的诊断。
Oct, 2024
本研究旨在解决当前深度学习模型在皮肤病诊断和治疗中面对的复杂多模态需求的不足。我们提出的PanDerm模型,通过在超过200万张真实皮肤病图像上进行自监督学习,展现出在各项临床任务中的卓越表现,尤其在早期黑色素瘤检测和多类别皮肤癌诊断准确性方面均优于临床医生。这一成果不仅提升了皮肤病管理的可能性,还为其他医学领域的多模态基础模型开发提供了借鉴。
Oct, 2024