BriefGPT.xyz
大模型
Ask
alpha
关键词
integer-only operations
搜索结果 - 1
基于内存的混合低精度量化,实现微控制器上深度网络推断
本文提出了一种新颖的端到端方法,用于在微控制器上部署低误差的深度神经网络,通过混合低位宽压缩,结合 8、4 或 2 位均匀量化,以整数运算来建模推理图,旨在确定每个激活和权重张量的最小位精度,摆脱了资源受限边缘设备的内存和计算限制,通过一个
→
PDF
5 years ago
Prev
Next