Sep, 2024

适应与修剪:快速且无需训练的多模态大型语言模型视觉标记修剪

TL;DR本研究解决了多模态大型语言模型(MLLMs)中视觉标记冗余及计算负担过重的问题。提出的FitPrune方法通过统计分析快速生成修剪方案,从而在保持高性能的同时显著减少计算复杂度。实验结果表明,该方法在不显著损失准确度的情况下,能够减少多达54.9%的计算量。