Oct, 2021

基于Hessian感知显著性的全局Vision Transformer压缩

TL;DR本研究提出了一种称为NViT的基于Hessian的全局结构裁剪方法,能够比以往更高效地利用ViT模型的参数,使得NViT-Base在ImageNet-1K数据集上具备了比DeiT-Base更高的准确率、更低的FLOPs和参数数量以及更快的运行速度。