Apr, 2022

MiniViT: 基于权重复用压缩视觉Transformer

TL;DR提出MiniViT压缩框架,利用权重多路复用和自注意力权重蒸馏相结合,显著减少参数数量,同时在视觉任务中保持高精度,找到解决Vision Transformer参数过多的问题的方法。