Dec, 2023

边缘推断的低精度混合计算模型

TL;DR该研究论文提出了一种混合计算神经网络处理方法,通过低精度的 Posit 和低精度定点 FixP 数值系统,为边缘应用提供支持,并利用启发式方法分析权重的重要性和量化误差,为不同权重分配正确的数值系统。通过在视觉和语言模型上的广泛评估,结果显示混合计算的准确性平均比 FixP 高约 1.5%,只需 0.19% 的能量开销。