ICLROct, 2022

Token Merging:让您的 ViT 更快

TL;DRToken Merging(ToMe)是一种简单的方法,可以提高现有 ViT 模型的吞吐量,无需进行训练。ToMe 逐渐合并转换器中相似的标记,使用一种通用且轻量级的匹配算法,可以像修剪一样快速,并具有更高的准确性。ToMe 的准确性和速度在图像、视频和音频方面的操作都具有竞争力。