BriefGPT.xyz
大模型
Ask
alpha
关键词
weight quantization strategy
搜索结果 - 1
深度神经网络加速器中的量化和映射协同探索
卷积神经网络(CNN)的能效和内存占用取决于权重量化策略和映射,通过启用丰富的混合量化方案,我们可以找到更有效利用硬件资源的映射,从而在精度、能耗和内存要求之间取得更好的平衡。通过扩展 Timeloop 工具,提出了一种高效的多目标优化算法
→
PDF
3 months ago
Prev
Next