Nov, 2024

通过掩蔽诱导半结构稀疏性以实现卷积网络中的高效模型推理

TL;DR本研究解决了卷积模型加速效果不足的问题,提出了一种新的方法,通过学习掩蔽的半结构稀疏性模式,利用现有硬件加速卷积模型。研究表明,该方法在推理时实现了超过两倍的加速,同时保持了模型性能和可更新性,确保了预测的稳定性界限。