Sep, 2023

梦幻LLM:综合多模态理解与创作

TL;DRDreamLLM是第一个能够生成自由排列内容的多模态大型语言模型,通过直接采样原始多模态空间中的语言和图像后验概率的生成建模,以及对原始的、交叉排列的文档进行建模,从而实现了在多模态理解和生成之间被经常忽视的协同作用,它的全面实验突显了其作为零样本多模态通用模型的卓越性能。