零 - shot 泛化的机器人运动规划的联邦强化学习

Mar, 2024

零 - shot 泛化的机器人运动规划的联邦强化学习

Federated reinforcement learning for robot motion planning with zero-shot generalization

Zhenyuan Yuan, Siyuan Xu, Minghui Zhu

TL;DR本文提出了一个零样本泛化的机器人运动规划学习控制策略的问题，在新环境中部署学习策略时不需要数据收集和策略调整；开发了一个联邦强化学习框架，可以实现多个学习者和中央服务器（云）协作学习，而无需共享原始数据；在每次迭代中，每个学习者上传本地控制策略和相应的估计归一化到达时间到云端，云端计算出多个学习者之间的全局最优解并广播最优策略给学习者；每个学习者从云端和本地控制策略中选择下一次迭代的策略；所提出的框架利用到达时间和安全性的零样本泛化保证。给出了几乎必定收敛、几乎共识、Pareto 改进和最优间隙的理论保证。通过蒙特卡洛仿真评估了提出的框架。

Abstract

This paper considers the problem of learning a control policy for robot motion planning with zero-shot generalization, i.e., no data collection and policy adaptation is needed when the learned policy is deployed in new environments. We develop a →

robot motion planning zero-shot generalization federated reinforcement learning arrival time monte carlo simulation

发现论文，激发创造

用于自主驾驶的联邦迁移强化学习

使用联邦学习的方法，将基于模拟器的强化学习模型实现动态的知识提取和共享，促进自动驾驶和机器人应用中的知识共享，进而在实时碰撞避免任务中实现更好的表现。

Oct, 2019

云边端 IoT 网络中基于联邦强化学习的动态调度任务的协作策略学习

本研究提出了一种动态调度任务的新型协作策略学习框架，该框架使用联邦强化学习并使用云边终端 IoT 网络的层次结构聚合不同边缘的本地策略并取得了很好的效果。

Jul, 2023

云机器人系统导航的生涯联合强化学习：一种学习架构

本研究提出了一种基于云机器人系统的全生命周期联邦强化学习架构 (LFRL)，包括知识融合算法和有效的迁移学习方法，证明它能够显著提高机器人导航的效率和融合前期知识的能力。

Jan, 2019

胜利的势头：异构环境下的协作联邦强化学习

我们提出了两个算法：FedSVRPG-M 和 FedHAPG-M，通过利用动量机制，不论环境异质性的大小，两个算法都可以精确收敛到平均性能函数的一个稳定点，进一步结合方差降低技术或海森矩阵近似，两个算法均达到了最新的收敛结果，其采样复杂度为 O (epsilon^(-3/2)/N)，同时我们的算法线性加速了收敛速度，并突显了在找到共同策略中代理之间合作的好处。

May, 2024

联邦强化学习：马尔可夫采样下的线性加速

本文提出了一种基于联邦学习的强化学习框架，使多方代理协作学习全局模型，同时保护个体数据隐私。对于联邦 TD 和 Q-learning 算法，我们证明了与代理数量成线性的收敛速度，这是首次考虑到马尔可夫噪声和多个本地更新的收敛分析。

Jun, 2022

联邦式集合指导下的离线强化学习

本文介绍了一种使用联邦学习平台上的分布式计算资源，基于集成学习方法开发的、名为 FEDORA 的算法，以解决联邦离线强化学习问题。我们展示了 FEDORA 在各种复杂的连续控制环境和真实世界数据集中明显优于其他方法，包括离线 RL 在合并数据池中，最终在移动机器人上演示了 FEDORA 的表现。

May, 2023

多机器人场景中去中心化联邦强化学习

本文提出了一种基于移动代理的方法，在 Webots 中用 Tartarus 来去中心化联邦学习，实现在连接机器人的情况下的去中心化联邦增强学习（dFRL），在基于 Q 学习和 SARSA 的实验中，通过聚集它们对应的 Q 表，证明了在机器人领域使用去中心化联邦学习的可行性。

Jul, 2022

面向多无人机协助边缘计算的个性化联邦深度强化学习轨迹优化

在 5G 移动通信时代，研究聚焦于无人机和移动边缘计算技术方面出现了显著增长。本研究提出了一种名为个性化联邦深度强化学习（PF-DRL）的新解决方案，用于多无人机轨迹优化。模拟结果表明，该算法具有更快的收敛速度和改善服务质量，优于其他基于深度强化学习的方法。

Sep, 2023

联邦模仿学习：一种适用于异构传感器云机器人系统的新型框架

本文介绍了一种新颖的基于云机器人系统的知识融合和转移框架 FIL，该框架通过融合来自本地机器人的异构知识并生成服务请求机器人的引导模型来实现云机器人系统中的姿态学习，同时还引入了一种知识转移方案来促进本地机器人从云中获取知识，最终实验结果表明 FIL 可以提高云机器人系统中本地机器人的姿态学习效率。

Dec, 2019

联邦深度强化学习

本文提出了一种新的深度强化学习框架 FedRL，旨在联邦地建立高质量的代理模型，其中考虑到其隐私，并通过利用高斯微分来保护数据和模型的隐私。在 Grid-world 和 Text2Action 领域的实验中，该框架与各种基线模型进行了比较。

Jan, 2019