Sep, 2023

多模型大语言模型中的灾难性遗忘研究

TL;DR通过将多模态大型语言模型(MLLM)视为图像分类器,并引入 EMT(用于评估 MLLM 中的灾难性遗忘)来评估现有的 MLLM 并检测到 fine-tuning 在图像分类任务上性能下降的问题。研究发现,几乎所有评估的 MLLM 在标准图像分类任务上都无法保持与视觉编码器相同的性能水平,并且尽管初期 fine-tuning 可以提高在其他图像数据集上的性能,但随着 fine-tuning 的进行,MLLM 开始产生幻觉,并导致了显著的泛化能力损失。因此,MLLM 在标准图像分类任务上的性能仍有待提高。