COLINGFeb, 2024

探索多模态大型语言模型的全局和局部语义表示

TL;DR研究发现,模型的中间层能够更好地编码全局语义信息,表征向量在视觉 - 语言蕴含任务中表现更好,而最顶层的模型可能过于关注局部信息,导致对全局信息编码能力减弱。