Jun, 2024

HuatuoGPT-Vision,面向大规模注入医学视觉知识的多模态语言模型

TL;DR通过使用 PubMedVision 数据集,我们对医学图像和文本进行了精炼和重构,从而改善了当前 MLLM 的医学多模态能力,并在医学多模态场景中展现了卓越的性能。