May, 2023

联邦式集合指导下的离线强化学习

TL;DR本文介绍了一种使用联邦学习平台上的分布式计算资源,基于集成学习方法开发的、名为 FEDORA 的算法,以解决联邦离线强化学习问题。我们展示了 FEDORA 在各种复杂的连续控制环境和真实世界数据集中明显优于其他方法,包括离线 RL 在合并数据池中,最终在移动机器人上演示了 FEDORA 的表现。