Feb, 2024

模型个性化:多模态大型语言模型中缓解灾难性遗忘

TL;DR该论文介绍了多模态大型语言模型(MLLMs)中灾难性遗忘现象的全面分析,并引入了一种名为 Model Tailor 的后训练调整方法。该方法主要保留了预训练参数,同时替换了少量(≤ 10%)的微调参数,相比于预训练,在原始任务上保持了约 99% 的有效性,并在新任务上相比标准微调获得了约 97% 的有效性。此外,该方法适用于多任务场景,并通过在 InstructBLIP 和 LLaVA-1.5 上进行广泛实验证明了显著的任务适应能力,同时保持了内在的预训练能力。