Sep, 2024
适应与修剪:快速且无需训练的多模态大型语言模型视觉标记修剪
Fit and Prune: Fast and Training-free Visual Token Pruning for
Multi-modal Large Language Models
TL;DR本研究解决了多模态大型语言模型(MLLMs)中视觉标记冗余及计算负担过重的问题。提出的FitPrune方法通过统计分析快速生成修剪方案,从而在保持高性能的同时显著减少计算复杂度。实验结果表明,该方法在不显著损失准确度的情况下,能够减少多达54.9%的计算量。