在模拟家庭环境中的联邦学习中学习社交合适的代理行为

Mar, 2024

在模拟家庭环境中的联邦学习中学习社交合适的代理行为

Federated Learning of Socially Appropriate Agent Behaviours in Simulated Home Environments

Saksham Checker, Nikhil Churamani, Hatice Gunes

TL;DR社交机器人在日常生活中的广泛应用中，确保它们的行为与社会规范相一致至关重要。为了实现广泛应用场景，探索个体机器人可以在了解自己独特环境的同时，也能从其他机器人的经验中学习的联邦学习（FL）设置是很重要的。本文介绍了一种新颖的FL基准，评估使用多标签回归目标的不同策略，其中每个客户端独立学习预测不同机器人行为的社会适切性，并与其他人分享其学习成果。此外，通过将训练数据根据不同的上下文进行分割，使每个客户端在不同的上下文中逐步学习，我们提出了一种新颖的联邦保持学习（FCL）基准，该基准将FL方法与最先进的连续学习（CL）方法结合起来，以在不同的上下文设置下持续学习社会适切的代理行为。加权的联邦平均（FedAvg）出现为一种强大的FL策略，而基于排练的FCL使得能够逐步学习机器人行为的社会适切性，跨越不同的上下文划分。

Abstract

As social robots become increasingly integrated into daily life, ensuring their behaviours align with social norms is crucial. For their widespread open-world application, it is important to explore federated learning

发现论文，激发创造

联邦学习中高效客户端选择的多智能体强化学习方法

本文提出了一种基于Multi-Agent Reinforcement Learning的Federated learning框架- FedMarl，该框架不仅可以显著提高模型精度，还能大幅降低处理延迟和通信成本，从而解决了Federated learning在实际应用中的训练效率问题。

Jan, 2022

FedFormer: 强化学习中的上下文联邦学习和注意力机制

该论文提出了一种名为FedFormer的新型联邦学习策略，使用Transformer Attention对不同学习者代理的模型进行上下文聚合嵌入，从而实现有效且高效的联邦学习，该方法在Meta-World环境中验证了其在联邦学习中的有效性并证明了在隐私约束下使用FedFormer可以实现更高的情节回报，同时还可以在特定任务中通过增加代理池来提高方法的效果表现，与之相比FedAvg无法在规模扩大时取得明显的改善。

May, 2022

联邦强化学习：马尔可夫采样下的线性加速

本文提出了一种基于联邦学习的强化学习框架，使多方代理协作学习全局模型，同时保护个体数据隐私。对于联邦TD和Q-learning算法，我们证明了与代理数量成线性的收敛速度，这是首次考虑到马尔可夫噪声和多个本地更新的收敛分析。

Jun, 2022

多机器人场景中去中心化联邦强化学习

本文提出了一种基于移动代理的方法，在Webots中用Tartarus来去中心化联邦学习，实现在连接机器人的情况下的去中心化联邦增强学习（dFRL），在基于Q学习和SARSA的实验中，通过聚集它们对应的Q表，证明了在机器人领域使用去中心化联邦学习的可行性。

Jul, 2022

联邦式集合指导下的离线强化学习

本文介绍了一种使用联邦学习平台上的分布式计算资源，基于集成学习方法开发的、名为FEDORA的算法，以解决联邦离线强化学习问题。我们展示了FEDORA在各种复杂的连续控制环境和真实世界数据集中明显优于其他方法，包括离线RL在合并数据池中，最终在移动机器人上演示了FEDORA的表现。

May, 2023

CEFHRI：一种用于识别工业人机交互的通信高效联邦学习框架

本研究提出了一种用于人机交互的通信高效联邦学习框架（CEFHRI），通过利用预训练模型和可训练的时空适配器来解决数据异构性和通信成本的挑战，实验证明CEFHRI相对于完全微调在通信成本上具有优势，为具有数据隐私关切和通信带宽有限的工业环境提供了安全高效的人机交互联邦学习方法。

Aug, 2023

知识融合的联邦持续学习：综述

Federated Continual Learning (FCL) integrates federated learning and continual learning to address the challenge of data privacy and silos, by fusing heterogeneous knowledge from different clients and retaining knowledge of previous tasks while learning on new ones, through methods such as synchronous FCL and asynchronous FCL.

Dec, 2023

狗散步理论: 重新思考联邦学习中的收敛性

该研究论文中，作者通过狗的牵引行为的比喻，提出了一种新的联邦学习算法FedWalk，该算法利用服务器端的一个容易收敛的任务作为“牵引任务”来指导客户端的本地训练，以解决现有FL算法中存在的一些问题，并通过在多个基准数据集上的实验证明了该算法在IID和非IID设置下优于现有的FL方法。

Apr, 2024

联邦行为平面：解释联邦学习中客户端行为的演化

通过引入联邦行为平面 (FBPs) 的分析方法，研究高度分布的深度学习环境中联邦学习 (FL) 系统的动态行为，提出了一种解决当前文献中关于客户行为的关键挑战的新方法，通过描述客户的行为状态和贡献来检测恶意或嘈杂的客户模型，从而提高安全性和超越现有的 FL 防御机制的功效。

May, 2024

结合联邦学习和控制: 一项调查

该论文概述了结合联邦学习（FL）和控制方法以增强非线性控制应用的适应性、可扩展性、泛化性和隐私性。通过保持数据本地化，FL在分布式设备上进行模型训练，实现协作学习并保护数据隐私，减少通信的网络带宽需求。该论文总结了结合FL和控制的最新概念和想法，进一步讨论了方法上的好处，最终详细概述了预期应用，从动态系统建模、控制器设计、自适应控制到多智能体决策系统中的知识传递。

Jul, 2024