Oct, 2023

Qilin-Med-VL: 面向通用医疗的中文大规模视觉语言模型

TL;DR该研究介绍了 Qilin-Med-VL,首个中文大型视觉语言模型,旨在集成对图文数据的分析,通过预训练的 Vision Transformer 和基础语言模型的两阶段课程训练过程增强了生成医学字幕和回答复杂医学查询的能力,同时发布了由超过 1M 个图文对组成的 ChiMed-VL 数据集,可用于对医学数据进行详细和全面的解释。