Oct, 2023

MiniGPT-v2:大型语言模型作为视觉语言多任务学习的统一接口

TL;DR利用MiniGPT-v2建立一个统一的界面,有效地处理各种视觉-语言任务,包括图像描述、视觉问答和视觉定位等,并通过使用唯一标识符提高模型在每个任务中的学习效率。