Jan, 2024

基于价值驱动的混合精度量化在微控制器上进行基于补丁的推理

TL;DR提出了一种名为 QuantMCU 的新的基于补丁的推断方法,利用价值驱动的混合精度量化来减少冗余计算。通过利用 Value-Driven Patch Classification(VDPC)和 Value-Driven Quantization Search(VDQS)来维持模型的准确性并降低搜索时间。实验结果表明,QuantMCU 减少了 2.2 倍的计算量,同时与最先进的基于补丁的推断方法相比保持了可比的模型准确性。