May, 2024
CheXpert Plus: 数十万对齐的放射学文本、图像和患者数据
CheXpert Plus: Hundreds of Thousands of Aligned Radiology Texts, Images
and Patients
TL;DRCheXpert Plus是放射学领域最大的公开发布的文本数据集,其中包含3600万个文本标记,包括1300万个印象标记。它代表了放射学领域最大的文本去识别努力之一,其中近100万个PHI跨度被匿名化。这是仅有的第二个在放射学领域发布的大规模英语成对数据集,首次实现了跨机构的大规模训练。我们希望这个数据集能够促进AI模型的研究,进一步协助放射科医生并改善医疗护理。