Jul, 2024

LiteGPT:用于联合胸部X射线定位和分类任务的大型视觉-语言模型

TL;DR我们提出了一种统一的框架 - LiteGPT,用于医学图像识别,并利用多个预训练的视觉编码器来提高视觉-语言模型的性能,我们是首次将视觉-语言模型应用于医学图像的联合定位和分类任务,并且在胸部X射线的疾病定位任务上,我们提供了基准性能,最后,在经过充分测试的VinDr-CXR数据集的图像分类任务中,我们确立了新的最佳性能标准。