CVPRMar, 2024

MADTP:多模态对齐引导的动态标记修剪加速视觉 - 语言转换器

TL;DR提出一种名为 MADTP 的新框架,通过多模态对齐和动态令牌修剪来加速各种视觉语言变换 (VLTs) 模型,显著减少计算复杂度同时保持竞争性能。