Nov, 2023

mPLUG-PaperOwl: 多模态大型语言模型的科学图解析

TL;DR通过强化多模态图表分析能力,我们构建了多模态图表理解数据集 M-Paper 并引入了控制信号‘outline’,通过与先进的多模态语言模型的全面实验,证明了在我们的数据集上进行训练能够展现更强大的科学图表理解性能.