Oct, 2023

MiniGPT-v2:大型语言模型作为视觉语言多任务学习的统一接口

TL;DR利用 MiniGPT-v2 建立一个统一的界面,有效地处理各种视觉 - 语言任务,包括图像描述、视觉问答和视觉定位等,并通过使用唯一标识符提高模型在每个任务中的学习效率。