ICCVAug, 2021
perf4sight:用于在边缘 GPU 上建模 CNN 训练性能的工具流
perf4sight: A toolflow to model CNN training performance on Edge GPUs
Aditya Rajagopal, Christos-Savvas Bouganis
TL;DR本研究提出了一种自动方法:perf4sight,它能够使用 PyTorch 作为框架和 NVIDIA Jetson TX2 作为目标设备,开发出准确预测 CNN 训练内存和延迟的模型,为边缘 GPU 上的高效网络调整铺平道路。