Sep, 2024

面向实际放射学的专家级视觉语言基础模型及其全面评估

TL;DR本研究解决了现有视觉语言模型在放射学领域的多模态复杂性不足的问题。提出的RadFound模型针对放射学训练,并引入增强的视觉编码器和统一的跨模态学习设计,以提升模型的多模态感知与生成能力。研究表明,RadFound在真实环境基准测试中显著优于其他模型,展示了其在临床工作流程中的广泛应用潜力。