Mar, 2022

FlexBlock:具有多模块浮点支持的灵活 DNN 训练加速器

TL;DR本研究提出使用多种 BFP 精度并结合算法优化的方法来加速训练深度神经网络,并基于此设计了一种灵活的训练加速器 FlexBlock,与其他训练加速器相比,在 CIFAR、ImageNet 和 WMT14 数据集上,训练速度提高了 1.5~5.3 倍,能效提高了 2.4~7.0 倍,准确度有所下降。