ICCVAug, 2021

perf4sight:用于在边缘 GPU 上建模 CNN 训练性能的工具流

TL;DR本研究提出了一种自动方法:perf4sight,它能够使用 PyTorch 作为框架和 NVIDIA Jetson TX2 作为目标设备,开发出准确预测 CNN 训练内存和延迟的模型,为边缘 GPU 上的高效网络调整铺平道路。