May, 2024

为在NVCIM加速器上高效部署DNN而设计的微小共享块

TL;DR通过在DNN架构中集成一个小的共享1x1卷积块,我们提出了“Tiny Shared Block (TSB)”方法,有效地减小了设备变异的影响,从而实现了超过20倍的推理准确性提升、超过5倍的训练加速和减少权重到设备映射成本,同时在编程期间只需要验证不到原始权重的0.4%。该方法为NVCIM加速器上部署稳健的DNN模型提供了实用和高效的解决方案,对于能效AI硬件领域具有重要贡献。