Nov, 2023

基于 Sam 引导的增强细粒度混合语义学习的医学图像字幕生成

TL;DR本文介绍了一种由 SAM 模型引导的新型医学图像字幕方法,以实现对医学图像的总体信息和细节进行增强编码,通过混合语义学习的独特预训练策略,同时捕捉医学图像的整体信息和细微细节,并证明了该方法在生成医学图像描述方面在各种评估指标上优于预训练的 BLIP2 模型。