Mar, 2024

SIP: 通过随机指令摄动自动调优 GPU 本地调度

TL;DR通过自动优化搜索空间和随机搜索方法,我们实现了 GPU 原生指令优化,从而进一步提高了 CUDA 核心的吞吐量,并通过 1000 万个测试样本对优化后的指令进行了测试。