DiffRate : 针对高效视觉 Transformer 的可区分压缩率

May, 2023

DiffRate : 针对高效视觉 Transformer 的可区分压缩率

DiffRate : Differentiable Compression Rate for Efficient Vision Transformers

Mengzhao Chen, Wenqi Shao, Peng Xu, Mingbao Lin, Kaipeng Zhang...

TL;DR本文提出了一种新颖的基于可微的压缩率的 token 压缩方法 (DiffRate)，通过学习不同网络层的压缩率实现同时进行 token 压缩和融合，实验结果表明 DiffRate 方法在保证准确率的前提下，能够有效降低 FLOPs 并提高推理效率。

Abstract

token compression aims to speed up large-scale vision transformers (e.g. ViTs) by pruning (dropping) or merging tokens. It is an important but challenging task. Although recent advanced approaches achieved great

token compression vision transformers differentiable compression rate flops reduction imagenet

发现论文，激发创造

一种用于 Vision Transformer 的快速无需训练的压缩框架

提出优化 Transformer 模型 (ViT) 部署过程中训练代价高的问题的快速无需训练压缩框架，其中包括初层的稠密特征提取器、压缩率更高的模型和利用空间关系的局部 - 全局令牌合并方法，在多个模型上实现了至多 2 倍的 FLOPS 减少和 1.8 倍的推理吞吐量提升，训练时间比现有方法节省两个数量级。

Mar, 2023

CAIT：面向 ViTs 的高精度、快速推理和良好可迁移性的三赢压缩

我们提出了一种联合压缩方法，用于 Vision Transformers（ViTs），旨在提供高准确性和快速推理速度，同时保持对下游任务的有利可传输性。具体来说，我们引入了不对称的令牌合并（ATME）策略来有效集成相邻的令牌，并引入一致的动态通道修剪（CDCP）策略来动态修剪 ViTs 中的不重要通道，大大提高了模型压缩效果。在基准数据集上进行的广泛实验表明，我们的方法在各种 ViTs 上都可以达到最先进的性能。

Sep, 2023

统一视觉 Transformer 压缩

本论文提出了一种统一的 ViT 压缩框架，其中使用了修剪、跳跃层和知识蒸馏等三种有效技术，经过在 ImageNet 数据集上的实验验证，我们的方法在保证精度的前提下有效压缩 Vision Transformers，比目前已有的压缩方法表现更优。

Mar, 2022

通过伪量化噪声实现可微分的模型压缩

本文提出了 DiffQ，一种不需要渐近梯度估计的可微方法，用于在训练期间对模型参数进行量化。DiffQ 在多个基准测试和体系结构上进行了实验验证，对于图像分类、语言建模和音频源分离等任务，能够优化每个权重或一组权重使用的位数，并在模型精度损失 0.3% 的情况下将 12 层的变压器模型压缩了超过 8 倍。

Apr, 2021

Vision Transformers 的统一剪枝框架

该论文提出了一种名为 UP-ViTs 的统一结构修剪框架，可在保持模型一致性的同时，压缩 Vision Transformer 等模型的体积并提高模型的准确性。实验证明，UP-ViTs 在 Object Detection 等任务中取得了不俗的性能，并在 ImageNet 上超越了传统的 ViTs 模型。

Nov, 2021

COMCAT：注重效率的基于注意力机制的视觉模型压缩和定制化

本文提出了一种高效的 ViT 压缩解决方案，该方法基于多头注意力层的新见解开发，可用于获得紧凑的基于注意力的视觉模型，并在图像分类任务中取得比最先进的剪枝方法更高的准确性。

May, 2023

记忆高效的视觉变换器：一种激活感知的混合秩压缩策略

本文提出了一种基于激活感知的模型压缩方法，通过使用不同层的低秩张量逼近来减少 Vision Transformers（ViTs）的参数数量，克服了内存限制，实现在内存受限环境中嵌入 ViTs 而不影响其性能。

Feb, 2024

高斯扩散下的有损压缩

本研究提出了一种基于无条件扩散生成模型的新型有损压缩方法 DiffC，该方法仅利用受高斯噪声污染的像素的有效通信来限制所需传输信息，具有压缩比 HiFiC 更高的性能表现，并提供流式解码支持，并进一步分析了其性能和一些理论界限。

Jun, 2022

联合 Token 剪枝与挤压：更激进的视觉 Transformer 压缩

采用新型 Token Pruning & Squeezing 模块（TPS）可以更高效地压缩视觉转换器，提高模型的计算速度和图像分类精度。

Apr, 2023

SPViT：通过软件 Token 剪枝加速视觉 Transformer

通过利用输入令牌稀疏性并提出计算感知的软剪枝框架，可以大幅减少 Vision Transformer 计算成本，并满足移动设备和 FPGA 的资源规格要求，甚至在移动平台上实现 DeiT-T 的实时执行。

Dec, 2021