Jun, 2022

面向边缘 AI 系统的自动高效 BERT 剪枝

TL;DR提出 AE-BERT,一种自动和高效的 BERT 剪枝框架,可在资源受限设备上实现基于 Transformer 自然语言处理模型并提高准确性。实验结果表明,在压缩模型后,与 CPU 相比使用 AE-BERT 产生的 BERT 基础编码器子网络可以在类似的总剪枝比率下获得更高的分数,并提高推理时间。