Nov, 2023

FLASH-RL: 使用强化学习解决联邦学习中的系统和静态异构问题

TL;DRFLASH-RL 是一种 Federated Learning 框架,利用 Double Deep Q-Learning 算法来处理系统和静态异质性,在 MNIST 和 CIFAR-10 数据集上展现了在模型效果和端到端延迟之间平衡取舍的有效性,相比现有解决方案,FLASH-RL 减少了 24.83% 的延迟,60.44% 的训练轮次,并在 MobiAct 数据集上相比 FedAVG 在模型性能方面提升了 2.82%,降低了 34.75% 的延迟,训练轮次也减少了 45.32%。