Sep, 2023
CAIT:面向ViTs的高精度、快速推理和良好可迁移性的三赢压缩
CAIT: Triple-Win Compression towards High Accuracy, Fast Inference, and
Favorable Transferability For ViTs
TL;DR我们提出了一种联合压缩方法,用于Vision Transformers(ViTs),旨在提供高准确性和快速推理速度,同时保持对下游任务的有利可传输性。具体来说,我们引入了不对称的令牌合并(ATME)策略来有效集成相邻的令牌,并引入一致的动态通道修剪(CDCP)策略来动态修剪ViTs中的不重要通道,大大提高了模型压缩效果。在基准数据集上进行的广泛实验表明,我们的方法在各种ViTs上都可以达到最先进的性能。