Oct, 2023

PPT:高效视觉Transformer的令牌修剪和池化

TL;DR通过在视觉Transformer模型中集成令牌剪枝和令牌汇聚技术,我们提出了一种名为令牌剪枝和汇聚Transformer(PPT)的新型加速框架,通过启发式方法自适应地应对两种不同层次的冗余,有效降低模型复杂性同时保持其预测准确性。例如,PPT在ImageNet数据集上使DeiT-S的FLOPs降低了37%,吞吐量提高了45%以上,而没有准确性下降。