CVPRApr, 2024

LLaMA-Excitor:通过间接特征交互进行通用指令调优

TL;DRLLaMA-Excitor 是一种基于轻量级方法的 LLMs 细调技术,通过逐渐更多地关注值得重视的信息,实现对指令的更好遵循,并保持 LLMs 的预训练知识。此方法在低质量指令遵循数据集的 LLMs 细调中表现出自适应分配额外关注的能力,并能在复杂的多模态对齐需求下将其扩展为强大的视觉指令跟踪器。我们的方法在仅语言和多模态调优实验场景中进行评估,以 MMLU 基准测试为例,LLaMA-Excitor 是唯一保持基本能力且实现显著改进(+6%)的方法。在视觉指令调优方面,我们在 MSCOCO 上实现了 157.5 CIDEr 的最新成果,并在 ScienceQA 上获得了与基于更多参数和广泛视觉语言相关模型相当的性能(88.39%)。