Jan, 2022

AI 模型效能工具包 (AIMET) 在神经网络量化中的应用

TL;DR本文介绍了使用 AI Model Efficiency Toolkit (AIMET) 进行神经网络量化的概述,其中 AIMET 包括多种基于 PyTorch 和 TensorFlow 的后训练量化和量化感知训练技术,可保证 8 位定点推理的接近浮点精度,并提供关于 PTQ 和 QAT 工作流程,代码示例和实用技巧的实用指南,以便用户有效地量化模型并获得低位整数推理的好处。