Oct, 2023
Qilin-Med-VL: 面向通用医疗的中文大规模视觉语言模型
Qilin-Med-VL: Towards Chinese Large Vision-Language Model for General
Healthcare
TL;DR该研究介绍了Qilin-Med-VL,首个中文大型视觉语言模型,旨在集成对图文数据的分析,通过预训练的Vision Transformer和基础语言模型的两阶段课程训练过程增强了生成医学字幕和回答复杂医学查询的能力,同时发布了由超过1M个图文对组成的ChiMed-VL数据集,可用于对医学数据进行详细和全面的解释。