Mar, 2023

使用图神经网络的深度学习推断性能预测模型 DIPPM

TL;DR本文介绍了一种基于深度学习推理性能预测模型的方法,该模型可以预测在 NVIDIA A100 GPU 上给定输入的深度学习模型的推理延迟、能量和内存使用情况,并建议适当的 GPU 配置方案,同时帮助进行模型推理性能的快速设计空间探索。