Apr, 2023

MiniGPT-4: 借助先进的大型语言模型增强视觉-语言理解

TL;DR本文介绍了 MiniGPT-4 模型,该模型利用像GPT-4这样的先进的大型语言模型(LLM)与视觉编码器对齐,可以生成详细的图像描述和从手写草图中创建网站等多重能力,采用对齐的图文数据集训练可以提高生成的可靠性和整体可用性。