ACLMay, 2023

PuMer:用于高效视觉语言模型的剪枝和合并机制

TL;DRPuMer 是一个使用文本感知修剪和模态感知合并策略的令牌减少框架,可通过在 VL 模型中添加轻量级令牌缩减器模块来改进模型推理速度和减少内存占用,从而提高了 VL 任务的推理吞吐量并减少了内存占用。