Jan, 2022

Egeria: 基于知识引导的层冻结技术用于高效 DNN 训练

TL;DR本文介绍了一种跳过计算和通信过程的深度神经网络培训方法,采用层冻结技术,通过量子化技术实时地生成参考模型,以达到评估每个层的训练效果并安全地冻结已经达到了期望的层的效果,从而获得 19% 至 43% 的培训速度提升。