CheXpert：一份具有不确定性标签和专家比较的大型胸透数据集

Jan, 2019

CheXpert：一份具有不确定性标签和专家比较的大型胸透数据集

CheXpert: A Large Chest Radiograph Dataset with Uncertainty Labels and Expert Comparison

Jeremy Irvin, Pranav Rajpurkar, Michael Ko, Yifan Yu, Silviana Ciurea-Ilcus...

TL;DRCheXpert是一个包含224,316个患者的65,240个胸部X射线片的大型数据集，通过自动检测放射学报告中14个观察结果的存在来捕捉放射X线解释中固有的不确定性，并且利用不同的不确定性方法来训练卷积神经网络，将此数据集作为标准基准来评估胸部X射线解释模型的性能。

Abstract

Large, labeled datasets have driven deep learning methods to achieve expert-level performance on a variety of medical imaging tasks. We present chexpert, a large dataset that contains 224,316 →

发现论文，激发创造

CheXNet: 深度学习实现胸部X光片放射学级别的肺炎检测

研究发现通过使用基于卷积神经网络的算法CheXNet，可以高于目前实践放射科医师的水平从胸部X光片中检测出肺炎，该算法使用了目前最大的公开数据集ChestX-ray14，并可以检测数据集中的14种疾病并达到最先进的结果。

Nov, 2017

利用卷积神经网络解释胸部X射线，利用分层疾病依赖性和不确定标签

该研究提出了一种基于深度卷积神经网络的监督式多标签分类框架，用于预测14种常见胸部疾病的风险，同时针对常见胸透数据集中不确定样本占据的显著比例，提出了标签平滑技术。在超过200k的数据集上训练，该模型在5项病理学的验证集中实现了0.940的平均AUC分数，表现高于独立测试集中的其他三位医学专家，该方法在CheXpert排行榜上排名第一。

Nov, 2019

深度胸透分类器中的公平差距

在医学影像方面，机器学习系统已经受到了广泛的关注。本文检查了最先进的深度学习分类器在从X光图像中产生诊断标签方面的性能偏差程度，发现在所有数据集，所有临床任务和所有子群体中都存在TPR差异。

Feb, 2020

利用层次疾病依赖和不确定标签通过CNN解释胸部X光片

利用深度卷积神经网络（CNNs）构建了一个多标签分类框架，能够准确检测14种常见胸部疾病和病灶的存在，通过对UGCXR数据集的训练，该模型取得了目前最高的AUC分数0.940，平均优于独立评审组中的2.6位放射科医生，表现优于目前CheXpert测试集上的其他分类器。

May, 2020

深度挖掘外部不完美数据用于胸部X光疾病筛查

本文提出了一种用于Chest X-ray的多标签分类深度学习框架，通过领域和标签的权重独立二进制任务方法以及任务特定的生成对抗网络训练，处理多个数据集之间的差异性，提高了分类准确度。在三个数据集上实验，AUC达到了0.8349，表明本文方法在使用外部数据集来提高内部分类方面具有很高的效果。

Jun, 2020

CheXtransfer: 使用ImageNet模型进行胸部X射线解读的性能和参数效率

本文研究了预训练模型在胸透解释方面的应用，通过对16种不同的卷积神经网络评估它们的迁移学习效果和参数效率，发现ImageNet性能和CheXpert性能之间不存在关系，而ImageNet预训练可以提高胸透解释的性能，并通过截取最后一层的方法使模型可节省3.25倍的参数而不影响性能。

Jan, 2021

临床推理胸部影像数据集

本研究提供了基于场景图的Chest ImaGenome数据集，利用自然语言处理和基于图集的边界框检测构建了局部标注，并通过放射学家构建的X线诊断本体论将每个CXR的注释连接为以解剖学为中心的场景图。

Jul, 2021

基于RNN患者监测的胸部X光分类改进

本文研究了利用病人历史记录信息的CNN图像分类模型。模型使用了Chest X-Ray成像技术，利用机器学习算法进行自动评估，展示出使用病人历史记录等附加信息时分类模型的性能显著提高。

Oct, 2022

CheX-GPT：利用大型语言模型增强胸部X射线报告标注

通过使用设计精心的提示，我们展示了GPT作为熟练标注器的潜力。利用只有GPT标记的数据，我们训练了基于BERT的标注器CheX-GPT，其操作速度更快、更高效。为了评估标注器的性能，我们引入了一个公开可用的专家标注测试集MIMIC-500，包含来自MIMIC验证集的500个案例。我们的研究结果证明了CheX-GPT不仅在标注准确性上优于现有模型，而且在效率、灵活性和可扩展性方面也表现出色，得益于我们引入的MIMIC-500数据集进行强大的基准测试。代码和模型可以在此链接找到。

Jan, 2024

CheXpert Plus: 数十万对齐的放射学文本、图像和患者数据

CheXpert Plus是放射学领域最大的公开发布的文本数据集，其中包含3600万个文本标记，包括1300万个印象标记。它代表了放射学领域最大的文本去识别努力之一，其中近100万个PHI跨度被匿名化。这是仅有的第二个在放射学领域发布的大规模英语成对数据集，首次实现了跨机构的大规模训练。我们希望这个数据集能够促进AI模型的研究，进一步协助放射科医生并改善医疗护理。

May, 2024