CVPRApr, 2022

MiniViT: 基于权重复用压缩视觉 Transformer

TL;DR提出 MiniViT 压缩框架,利用权重多路复用和自注意力权重蒸馏相结合,显著减少参数数量,同时在视觉任务中保持高精度,找到解决 Vision Transformer 参数过多的问题的方法。