Mar, 2022

跨设备联邦学习中语言模型尺寸的扩展

TL;DR本文利用局部模型训练、量化、有效的迁移学习和通信高效的优化器等技术来解决服务器 - 客户端通信和设备上计算的瓶颈,实现跨设备联邦学习中的较大语言模型训练,并且获得了与小型 LSTM 相当甚至更好的困惑度和更低的客户端到服务器通信成本。