CVPRMar, 2024
MADTP:多模态对齐引导的动态标记修剪加速视觉 - 语言转换器
MADTP: Multimodal Alignment-Guided Dynamic Token Pruning for Accelerating Vision-Language Transformer
Jianjian Cao, Peng Ye, Shengze Li, Chong Yu, Yansong Tang...
TL;DR提出一种名为 MADTP 的新框架,通过多模态对齐和动态令牌修剪来加速各种视觉语言变换 (VLTs) 模型,显著减少计算复杂度同时保持竞争性能。