Oct, 2023

Look-Up mAI GeMM: 通过 msGeMM 将 AI GeMMs 性能提升近 2.5 倍

TL;DR该论文介绍了一种名为 msGeMM 的新算法,该算法表明低精度数据类型的 AI 模型可以在更少的乘法和加法指令的情况下运行,要求 CUDA 核心具有与 Tensor Cores 相同的能力来从小的查找表中添加元素。