Sep, 2018

Mini-batch Serialization: CNN 训练中的层间数据重用

TL;DR介绍了一种名为 MBS CNN 训练方法以及 WaveCore CNN 训练加速器,它们通过在芯片缓冲区内优化复用而不是访问外部内存来减少内存访问并分别降低 DRAM 流量 75% 和系统能量 26%。