Jul, 2024

ARTEMIS:Transformer神经网络的混合模拟-随机In-DRAM加速器

TL;DR通过使用 PIM/NMC 架构以及利用新型的 in-DRAM 金属-金属电容器支持随机计算和时间模拟累加,我们提出了 ARTEMIS,一个用于 Transformer 模型的混合模拟-随机的 in-DRAM 加速器,通过对传统 DRAM 数组进行最小化改变,ARTEMIS 在执行 Transformer 模型时高效地减轻了相关成本,相较于 GPU、TPU、CPU 和先进的 PIM Transformer 硬件加速器,ARTEMIS 达到了至少 3.0 倍的加速、1.8 倍低能量消耗以及 1.9 倍更好的能效。