Jun, 2024

MMNeuron:发现多模态大语言模型中的神经元级领域特定解释

TL;DR通过研究多模态大型语言模型的内部机制,我们在多语种研究的启发下,发现了多模态大型语言模型中的领域特定神经元,并研究了这些模型如何处理来自不同领域的特征。进一步地,我们提出了一个三阶段的语言模型模块框架,用于处理投影的图像特征,并使用逻辑镜头验证了这一假设。大量实验证明,虽然当前的多模态大型语言模型具备视觉问答的能力,但它们可能没有充分利用领域特定的信息。适当地操纵领域特定的神经元最多会导致 10% 的准确率变化,为未来跨领域、全方位的多模态大型语言模型的发展提供了启示。我们的代码将在论文通知后发布。