Nov, 2024
持续LLaVA:大规模视觉语言模型中的持续指令调优
Continual LLaVA: Continual Instruction Tuning in Large Vision-Language
Models
TL;DR该研究解决了现有大型视觉语言模型(LVLMs)在单任务适应中无法应对现实世界多样化和不断变化的需求的问题。提出的新方法“持续LLaVA”通过冻结LVLMs并构建双增量嵌入,有效支持再调优,并显著减少遗忘现象。这项研究的最显著发现是持续LLaVA在持续指令调优过程中优于以往方法,减少了知识遗忘,提高了模型的适应性。