Mar, 2024

近期大型视觉 - 语言模型的有效性评估

TL;DR大视觉语言模型在专业任务和通用任务中的效能进行综合评估,发现它们在专业任务和通用任务中均表现有限,可能的因素包括专业任务认知有限、物体幻觉、文本与图像的干扰以及在复杂问题中的鲁棒性降低。