Feb, 2022

Vau da muntanialas: RNN 推断的能效多芯片可扩展加速

TL;DR利用 Muntaniala 架构为 LSTM 推理提供 RNN 加速器,实现了 3.25$TOP/s/W$ 的芯片测量能效和 30.53$GOP/s$ 的性能。