Aug, 2023

敏感性感知的混合精度量化和宽度优化:通过基于聚类的树结构 Parzen 估计实现深度神经网络的优化

TL;DR通过引入创新的搜索机制,基于深度学习模型的优化方法,在神经网络设计方面取得了重要突破。该方法有效选择了每个神经网络层的最佳比特宽度和层宽,提高了深度神经网络的效率。通过采用基于 Hessian 的修剪方法来减少搜索空间,并利用基于聚类的树状 Parzen 估计器构建代理模型,对各种架构进行快速的探索和定位。在多个数据集上的严格测试表明,该方法相对于现有方法具有明显的优势,模型大小减少了 20% 且准确度不降低。相较于现有的最佳搜索策略,该方法的搜索时间减少了 12 倍。因此,该方法为神经网络设计优化提供了快速、高效的解决方案,推动了可扩展深度学习解决方案的潜力。