Dec, 2023

通过累积本地更新改进联邦蒸馏的通信效率

TL;DR通过在学习过程中传输只有小规模知识,作为一种新兴的联合训练范式,联合蒸馏能够实现高效的模型训练。为了进一步提高联合蒸馏的通信效率,我们提出了一种新的技术,ALU,它在将知识传输到中央服务器之前累积多个局部更新轮次。ALU 显著降低了联合蒸馏中的通信频率,从而大大减少了训练过程中的通信开销。实证实验表明,ALU 显著提高了联合蒸馏的通信效率。