Sep, 2023

CAIT:面向 ViTs 的高精度、快速推理和良好可迁移性的三赢压缩

TL;DR我们提出了一种联合压缩方法,用于 Vision Transformers(ViTs),旨在提供高准确性和快速推理速度,同时保持对下游任务的有利可传输性。具体来说,我们引入了不对称的令牌合并(ATME)策略来有效集成相邻的令牌,并引入一致的动态通道修剪(CDCP)策略来动态修剪 ViTs 中的不重要通道,大大提高了模型压缩效果。在基准数据集上进行的广泛实验表明,我们的方法在各种 ViTs 上都可以达到最先进的性能。