Aug, 2023

TVM 中的量化分析

TL;DR通过分析性能问题并解决图构建中的错误,我们成功改进了量化,并分析多种优化策略,实现了与 TVM 编译基准相比分别达到计算密集任务 163.88% 和内存密集任务 194.98% 的推理时间改进。