May, 2023

DiffRate : 针对高效视觉 Transformer 的可区分压缩率

TL;DR本文提出了一种新颖的基于可微的压缩率的 token 压缩方法 (DiffRate),通过学习不同网络层的压缩率实现同时进行 token 压缩和融合,实验结果表明 DiffRate 方法在保证准确率的前提下,能够有效降低 FLOPs 并提高推理效率。