Mar, 2024

在模拟家庭环境中的联邦学习中学习社交合适的代理行为

TL;DR社交机器人在日常生活中的广泛应用中,确保它们的行为与社会规范相一致至关重要。为了实现广泛应用场景,探索个体机器人可以在了解自己独特环境的同时,也能从其他机器人的经验中学习的联邦学习(FL)设置是很重要的。本文介绍了一种新颖的FL基准,评估使用多标签回归目标的不同策略,其中每个客户端独立学习预测不同机器人行为的社会适切性,并与其他人分享其学习成果。此外,通过将训练数据根据不同的上下文进行分割,使每个客户端在不同的上下文中逐步学习,我们提出了一种新颖的联邦保持学习(FCL)基准,该基准将FL方法与最先进的连续学习(CL)方法结合起来,以在不同的上下文设置下持续学习社会适切的代理行为。加权的联邦平均(FedAvg)出现为一种强大的FL策略,而基于排练的FCL使得能够逐步学习机器人行为的社会适切性,跨越不同的上下文划分。