使用 NEAT 算法学习机器人群体的新兴行为
本文研究了机器人群体控制器的设计,并探索了一种进化方法来缓解人类开发者对控制器细节和群体行为之间联系的困难。使用微分进化来发展神经网络控制器,实现机器人遵循环境特征的梯度并解决任务。研究表明,进化所得解决方案在控制较差的情况下具有最大的灵活性,而有一个群体规模的 “甜蜜点”,同时观察到群体的集体运动,展示了真正的新兴行为,这是进化过程中未被代表和选择的。
Mar, 2022
提出了一种利用自我监督学习和人机交互查询自适应用户偏好的相似度空间来探索并分类可能出现的集群行为的方法,并在两个机器人能力模型的模拟实验中测试,发现该方法比之前的工作更能发现出丰富的集群行为。
Apr, 2023
通过大量的实验和消融分析,我们分析了不同表征、进化搜索和各种聚类方法在异构群体中寻找新行为的影响。我们的研究结果表明,先前的方法未能发现许多有趣的行为,而迭代人在环节的发现过程比随机搜索、群体化学和自动化行为发现方法发现了更多的行为。我们的实验中发现了 23 个新的紧急行为,其中 18 个是新发现。据我们所知,这些是首个已知的计算无关代理异构群体的紧急行为。
Oct, 2023
本文研究了如何使用有限的传感能力控制一组合作智能体,使用了基于演员 - 评论家算法的深度强化学习以近似 Q 值函数和策略评估,评估了在寻找和维持距离和定位目标方面的性能。
Sep, 2017
该研究提出了一种多目标进化神经网络方法,用于开发群体机器人的控制器。该方法通过低保真度的 Python 模拟器训练群体机器人控制器,然后在高保真度的 Webots 模拟环境中进行测试。结果表明,该方法可以有效控制每个机器人,且控制器具有可扩展性,而且不需要进一步重新训练。
Jul, 2023
本研究主要探讨了如何应用基于观察专家演示的控制器学习算法,训练出端到端的神经网络,用于解决协作多智能体系统中的分布式控制问题,实验结果表明,使用通信策略可以有效提高分布式模型的性能。
Feb, 2023
本文通过进化博弈理论和基于代理的建模和仿真技术,对在多智能体系统中通过多个交互者的存在和互动的多种行为策略下涌现和演变的集体行为机制的主要研究方向和挑战进行了总结,包括将认知和情感机制引入智能体的实现、在复杂网络中促进亲社会行为的成本效益干预、AI 安全发展生态的监管和治理以及随机演化多人游戏的平衡分析。总之,本文描述了该小组视图或优先考虑的 MAS 研究中的重要开放问题。
May, 2022
通过引入具有连续模拟物理的具有挑战性的竞争性多智能体足球环境,我们研究了加强学习智能体中合作行为的出现。我们演示了分散、基于人口的联合训练能够导致代理行为的进步:从随机的行为到简单的球追逐,最终呈现出合作的迹象。我们进一步应用了一个由博弈论原理支持的评估方案,可以在没有预定义评估任务或人类基准的情况下评估代理的性能。
Feb, 2019