使用 NEAT 算法学习机器人群体的新兴行为

Sep, 2023

使用 NEAT 算法学习机器人群体的新兴行为

Learning Emergent Behavior in Robot Swarms with NEAT

Pranav Rajbhandari, Donald Sofge

TL;DR通过进化算法训练分布式机器人群体算法以产生新兴行为，并在不同模式的操纵下进行了模拟实验和评估。

Abstract

When researching robot swarms, many studies observe complex group behavior emerging from the individual agents' simple local actions. However, the task of learning an individual policy to produce a desired

robot swarms emergent behavior distributed robotic swarm algorithms evolutionary algorithm group behavior

发现论文，激发创造

受环境影响的演化群体具有有限感知能力的集体行为出现

本文研究了机器人群体控制器的设计，并探索了一种进化方法来缓解人类开发者对控制器细节和群体行为之间联系的困难。使用微分进化来发展神经网络控制器，实现机器人遵循环境特征的梯度并解决任务。研究表明，进化所得解决方案在控制较差的情况下具有最大的灵活性，而有一个群体规模的 “甜蜜点”，同时观察到群体的集体运动，展示了真正的新兴行为，这是进化过程中未被代表和选择的。

Mar, 2022

利用人类反馈在机器人群体中演化和发现新兴行为

提出了一种利用自我监督学习和人机交互查询自适应用户偏好的相似度空间来探索并分类可能出现的集群行为的方法，并在两个机器人能力模型的模拟实验中测试，发现该方法比之前的工作更能发现出丰富的集群行为。

Apr, 2023

适应不同觅食环境的人工学习智能体群行为发展

应用投影模拟和强化学习方法研究了人工智能智能体在收集资源过程中不同集体运动模式和个体运动趋势

Apr, 2020

有限能力机器人异构群体的行为探索方法研究

通过大量的实验和消融分析，我们分析了不同表征、进化搜索和各种聚类方法在异构群体中寻找新行为的影响。我们的研究结果表明，先前的方法未能发现许多有趣的行为，而迭代人在环节的发现过程比随机搜索、群体化学和自动化行为发现方法发现了更多的行为。我们的实验中发现了 23 个新的紧急行为，其中 18 个是新发现。据我们所知，这些是首个已知的计算无关代理异构群体的紧急行为。

Oct, 2023

进化异质群体中专业集体行为的形成

通过表型可塑性在模拟机器人群体中研究专门化的集体行为的出现，并设计了一种在线调节机制来增强整体性能和可扩展性。

Feb, 2024

群体系统的引导深度强化学习

本文研究了如何使用有限的传感能力控制一组合作智能体，使用了基于演员 - 评论家算法的深度强化学习以近似 Q 值函数和策略评估，评估了在寻找和维持距离和定位目标方面的性能。

Sep, 2017

演化多目标神经网络控制机器人群

该研究提出了一种多目标进化神经网络方法，用于开发群体机器人的控制器。该方法通过低保真度的 Python 模拟器训练群体机器人控制器，然后在高保真度的 Webots 模拟环境中进行测试。结果表明，该方法可以有效控制每个机器人，且控制器具有可扩展性，而且不需要进一步重新训练。

Jul, 2023

学习通信感知协调的机器人群体模拟

本研究主要探讨了如何应用基于观察专家演示的控制器学习算法，训练出端到端的神经网络，用于解决协作多智能体系统中的分布式控制问题，实验结果表明，使用通信策略可以有效提高分布式模型的性能。

Feb, 2023

多智能体系统中的演化博弈理论对新兴行为的理解

本文通过进化博弈理论和基于代理的建模和仿真技术，对在多智能体系统中通过多个交互者的存在和互动的多种行为策略下涌现和演变的集体行为机制的主要研究方向和挑战进行了总结，包括将认知和情感机制引入智能体的实现、在复杂网络中促进亲社会行为的成本效益干预、AI 安全发展生态的监管和治理以及随机演化多人游戏的平衡分析。总之，本文描述了该小组视图或优先考虑的 MAS 研究中的重要开放问题。

May, 2022

竞争中的协同涌现

通过引入具有连续模拟物理的具有挑战性的竞争性多智能体足球环境，我们研究了加强学习智能体中合作行为的出现。我们演示了分散、基于人口的联合训练能够导致代理行为的进步：从随机的行为到简单的球追逐，最终呈现出合作的迹象。我们进一步应用了一个由博弈论原理支持的评估方案，可以在没有预定义评估任务或人类基准的情况下评估代理的性能。

Feb, 2019