Jan, 2023

利用分治原则提高机器学习推理性能

TL;DR本文探讨了在 CPU 上部署机器学习模型的缩放问题,提出了一种基于分而治之原则的简单而有效的方法来解决这个实际重要的问题,在 OnnxRuntime 框架中实施并用几个用例来评估其有效性,包括用于 OCR 和 NLP 的著名模型。