May, 2024

CheXpert Plus: 数十万对齐的放射学文本、图像和患者数据

TL;DRCheXpert Plus 是放射学领域最大的公开发布的文本数据集,其中包含 3600 万个文本标记,包括 1300 万个印象标记。它代表了放射学领域最大的文本去识别努力之一,其中近 100 万个 PHI 跨度被匿名化。这是仅有的第二个在放射学领域发布的大规模英语成对数据集,首次实现了跨机构的大规模训练。我们希望这个数据集能够促进 AI 模型的研究,进一步协助放射科医生并改善医疗护理。