Jan, 2024

RAD-DINO: 探索可扩展的医学影像编码器:超越文本监督

TL;DR在计算机视觉和医学图像领域的多模态系统中,语言监督的预训练被证明是从图像中提取语义有意义特征的有价值方法。然而,由于文本包含的信息有限,得到的特征受到了限制。在医学图像中,这一点尤为严重,因为放射科医生的书面结果侧重于特定观察,而相关图像 - 文本数据的稀缺性增加了挑战。本文通过在仅使用单模态医学图像数据进行预训练,引入了 RAD-DINO,一种基于生物医学图像的编码器,其性能在各种基准测试中比最先进的基于生物医学语言的监督模型取得了相似或更好的表现。