ICMLJul, 2023
基于学习的阈值令牌合并和修剪用于视觉 Transformer
Learned Thresholds Token Merging and Pruning for Vision Transformers
Maxim Bonnaerens, Joni Dambre
TL;DR这篇论文介绍了一种名为 LTMP 的学习阈值符号合并和修剪方法,它通过动态确定合并和修剪的符号,以降低计算视觉变换器所需的输入符号数量,实现了在降低速率的同时保持最先进的准确性,在仅一个微调阶段的情况下比先前的方法快一个数量级以上。