Jun, 2023

带有卷积操作和且非卷积操作的 DNN 推理 / 训练性能分析

TL;DR本文提出了一种针对深度学习加速器的性能分析框架 ——SimDIT,旨在覆盖卷积和非卷积操作,并提供详细的执行 CNN 推断和训练工作量的端到端性能统计,结果显示,在使用一个 64X64 处理阵列时,ResNet-50 训练工作量的非卷积操作占总运行时间的 59.5%。此外,通过优化可用的片外 DRAM 带宽和片上 SRAM 资源的分配,SimDIT 实现了比 ResNet-50 推理的通用静态资源分配高出 18 倍的性能提升。