May, 2024

从算法到硬件:深度神经网络高效安全部署综述

TL;DR深度神经网络(DNNs)在许多人工智能(AI)任务中被广泛使用,为了解决其部署带来的巨大的内存、能量和计算成本挑战,研究人员开发了各种模型压缩技术,最近还有越来越多的研究关注定制化DNN硬件加速器以更好地利用模型压缩技术,此外,保护安全和隐私对于部署DNNs至关重要,我们的研究综述首先涵盖主流的模型压缩技术,如模型量化、模型修剪、知识蒸馏和非线性运算优化,然后介绍了设计可以适应高效模型压缩方法的硬件加速器的最新进展,此外,我们还讨论了如何将同态加密集成到安全DNN部署中,最后,我们讨论了硬件评估、泛化和各种压缩方法的集成等几个问题,总体来说,我们旨在从算法、硬件加速器和安全性角度提供高效DNN的整体概况。