Apr, 2023

eFAT: 提高 DNN 硬件加速器容错训练效果以减轻永久故障

TL;DR本文提出一种名为 eFAT 的新型框架,它采用鲁棒性驱动的重新选择训练量和分组,以及多种错误映射的融合,从而显著降低了针对多个有故障芯片的 DNN 进行调优时的重新训练成本。