Oct, 2024

ARQ:一种适用于准确且可证明鲁棒性的混合精度量化框架

TL;DR本研究解决了深度神经网络(DNN)在资源有限的计算平台上执行时的量化鲁棒性不足的问题。提出的ARQ方法通过强化学习寻找到既准确又鲁棒的DNN量化方案,同时利用随机平滑技术指导搜索过程,保证了分类器的清洁准确性和认证鲁棒性。实验结果表明,ARQ在多个基准测试中优于传统量化技术,甚至在许多情况下与原始浮点权重的DNN性能相当,但仅需1.5%的指令集。