Jun, 2024

MG-LLaVA:面向多粒度视觉指导调整

TL;DR采用多种视觉特征与语言模型相结合的创新方法MG-LLaVA,在感知任务中提供了出色的表现,并且超越了相似参数规模的现有模型,具备出色的目标识别能力。