May, 2024

CLIP中的语言增强技术对多模态医学图像的改进解剖检测

TL;DR使用多模态的医学影像,利用视觉语言模型(CLIP)自动生成整体身体的标准化分区和器官列表,相较于基线模型(PubMedCLIP),提高性能达到47.6%。