Jan, 2025

分析多模态大规模语言模型微调表示的变化与对齐

TL;DR本研究解决了对多模态大规模语言模型在微调过程中表示动态变化的理解不足问题。通过系统分析隐状态表示的演变,揭示了微调如何改变模型的内部结构以专注于新的多模态任务,并提出了使用位移向量捕捉概念变化的创新方法。研究结果表明,可以在不进行任何训练的情况下调整多模态大模型的行为,具有显著的实际影响。