Jan, 2025

全球指导的压缩:无训练高分辨率多模态大语言模型加速

TL;DR本研究针对多模态大语言模型(MLLMs)在推理效率上的挑战,提出了一种新型的令牌压缩方法GlobalCom$^2$,该方法专为处理高分辨率图像的MLLMs设计。通过将缩略图中提取的令牌视为整个压缩过程的“指挥官”,GlobalCom$^2$能够有效优化保留比率,消除冗余令牌并适应性地保留重要细节,实验结果显示其在性能与效率之间达到最佳平衡,超越了现有的压缩方法。