Oct, 2023

基于机器学习和分析模型的 GPU 嵌入式系统性能调优方法

TL;DR本论文研究了 GPU 嵌入式系统上的调优方法,并比较了基于分析模型和基于机器学习的调优方法的性能,在 NVIDIA Jetson 系统上评估了 BPLG 库的不同并行前缀实现的性能,并与穷举搜索的性能进行了比较,为解决服务器和嵌入式设备间主要计算模式的性能可移植性提供了实用指导。