Sep, 2023

朝着可靠的皮肤病评估基准

TL;DR数字皮肤病学中的基准数据集不知不觉地包含了不准确的信息,这减少了对模型性能评估的信任。我们提出一种资源高效的数据清洗协议,用于识别之前筛选中遗漏的问题。该协议利用现有的算法清洗策略,并在直观的终止准则下进行确认过程。基于多位皮肤科医生的确认,我们移除了不相关的样本和近似重复,并估计了由国际皮肤影像协作组推广的六个皮肤科图像数据集中标签错误的百分比,以进行模型评估。随着本文的发布,我们为每个数据集发布了经修订的文件列表,应用于模型评估。我们的工作为数字皮肤病学中更可靠的性能评估铺平了道路。