Jul, 2024

权重块稀疏化:训练、编译与人工智能引擎加速器

TL;DR通过在预训练的深度神经网络模型的卷积和全连接层参数中将特定区域置零,实现权重块稀疏性,提高了神经网络的推理速度,减小了内存占用和计算负载。在使用Resnet50模型中,权重减少一半的同时保持准确性损失最小,推理速度提高两倍。