Oct, 2024

通过持续学习改善多模态大型语言模型

TL;DR本研究解决了多模态大型语言模型在整合预训练视觉模型后,语言理解与生成任务性能显著下降的问题。提出将整合视为持续学习问题,并评估五种方法以减轻遗忘现象,从而找到一种减少语言性能损失的技术,最终使语言性能下降幅度最多降低15%,同时保持高效的多模态准确性。