MIMIC-CXR-JPG:一个大型公开可用的带标签胸部 X 射线数据库
本研究介绍了一个包含超过 10 万张胸部 X 射线扫描的数据集,其中 18000 张图像被 17 名经验丰富的放射科医生手动标注,包括 22 个异常部位的局部标签和 6 个可疑疾病的全局标签,该数据集的发布将为胸部异常的检测和定位的机器学习算法的发展提供帮助。
Dec, 2020
本文介绍了使用 MIMIC-CXR 数据集训练并评估深度卷积神经网络来识别多种常见胸部疾病的结果,提出了一种可以同时处理前后位胸透图像的新型 DualNet 体系结构,并通过与使用单独基准前位和侧位分类器进行比较来展示 DualNet 体系结构的性能提升。
Apr, 2018
本文介绍了一个新的胸部 X 光数据库,名为 “ChestX-ray8”,其中包括 108948 个患者的 32,717 个独特患者的前瞻性 X 光图像 和使用自然语言处理从相关放射学报告中提取的八个疾病图像标签。作者展示了这些常见的胸部疾病可以通过弱监督的多标签图像分类和疾病定位框架进行检测甚至空间定位,并证明了这一点。尽管初始数量结果报告良好,但基于深度卷积神经网络的 “阅读胸部 X 射线”(仅通过图像级标签训练)仍然是完全自动化的高精度 CAD 系统的艰巨任务。
May, 2017
本文介绍了一个标记大规模、高分辨率的胸部 X 光数据集,用于自动探索医学图像和相关报告,并在报告中标记了 174 个不同的放射学发现,19 个不同的差异诊断和 104 个不同的解剖部位位置,这些标记数据可用于训练监督模型关于放射学图像的分析与识别。此数据集可在 http URL 下载。
Jan, 2019
本文旨在探讨开放式医疗数据集的质量控制问题,通过对 ChestXray14 和 MURA 两个数据集的视觉比对,发现标签的准确性存在问题,该研究建议公开数据集制作者应当进行质量控制并提供详细的数据生成过程及标注规则描述。
Jul, 2019
CheXpert 是一个包含 224,316 个患者的 65,240 个胸部 X 射线片的大型数据集,通过自动检测放射学报告中 14 个观察结果的存在来捕捉放射 X 线解释中固有的不确定性,并且利用不同的不确定性方法来训练卷积神经网络,将此数据集作为标准基准来评估胸部 X 射线解释模型的性能。
Jan, 2019
本研究提供了基于场景图的 Chest ImaGenome 数据集,利用自然语言处理和基于图集的边界框检测构建了局部标注,并通过放射学家构建的 X 线诊断本体论将每个 CXR 的注释连接为以解剖学为中心的场景图。
Jul, 2021
COVIDx CXR-4 是一种新的开源数据集,通过增加总患者群体大小,从多个机构收集来自 45,342 位患者的 84,818 张胸部 X 射线图像,以改善 COVID-19 的计算机辅助诊断,从而提高 COVID-19 诊断的性能。
Nov, 2023
该研究调查了将多样的患者数据源整合到多模态语言模型中,用于自动化胸部 X 射线报告生成。通过使用 MIMIC-CXR 和 MIMIC-IV-ED 数据集,该研究通过整合详细的患者信息,如不定期的生命体征、药物和临床病史,将异质数据源转化为嵌入向量,从而显著提高了生成放射学报告的诊断准确性。全面的评估显示了使用更广泛的患者数据的好处,强调了通过将多模态数据整合到胸部 X 射线报告生成中可以提高诊断能力和改善患者预后的潜力。
Jun, 2024
该研究提出了一种基于深度卷积神经网络的监督式多标签分类框架,用于预测 14 种常见胸部疾病的风险,同时针对常见胸透数据集中不确定样本占据的显著比例,提出了标签平滑技术。在超过 200k 的数据集上训练,该模型在 5 项病理学的验证集中实现了 0.940 的平均 AUC 分数,表现高于独立测试集中的其他三位医学专家,该方法在 CheXpert 排行榜上排名第一。
Nov, 2019