Apr, 2024

Allo: 可组合加速器设计的编程模型

TL;DR通过使用Allo编程模型,我们提出了一种有效的空间加速器设计方法,能够在各种应用和深度学习模型中取得更好的性能和能源效率,相比于NVIDIA A100 GPU,Allo生成的加速器在GPT2模型上具有1.7倍的推理延迟和5.4倍的能源效率提升。