Dec, 2020

AttentionLite: 面向视觉的高效自注意力模型

TL;DR本文提出了一种新的框架 AttentionLite,用于生产一类参数和计算效率高的模型,同时结合知识蒸馏和剪枝机制并利用自注意代替卷积进行联合优化,使得模型训练和精细调节的时间大大减少,实验显示 AttentionLite 模型的参数效率可提高 30 倍,计算效率可提高 2 倍且并不影响其准确性。