利用人类反馈在机器人群体中演化和发现新兴行为

Apr, 2023

利用人类反馈在机器人群体中演化和发现新兴行为

Leveraging Human Feedback to Evolve and Discover Novel Emergent Behaviors in Robot Swarms

Connor Mattson, Daniel S. Brown

TL;DR提出了一种利用自我监督学习和人机交互查询自适应用户偏好的相似度空间来探索并分类可能出现的集群行为的方法，并在两个机器人能力模型的模拟实验中测试，发现该方法比之前的工作更能发现出丰富的集群行为。

Abstract

robot swarms often exhibit emergent behaviors that are fascinating to observe; however, it is often difficult to predict what swarm behaviors can emerge under a given set of agent capabilities. We seek to efficie

robot swarms emergent behaviors multi-agent system self-supervised learning novelty search

发现论文，激发创造

有限能力机器人异构群体的行为探索方法研究

通过大量的实验和消融分析，我们分析了不同表征、进化搜索和各种聚类方法在异构群体中寻找新行为的影响。我们的研究结果表明，先前的方法未能发现许多有趣的行为，而迭代人在环节的发现过程比随机搜索、群体化学和自动化行为发现方法发现了更多的行为。我们的实验中发现了 23 个新的紧急行为，其中 18 个是新发现。据我们所知，这些是首个已知的计算无关代理异构群体的紧急行为。

Oct, 2023

使用 NEAT 算法学习机器人群体的新兴行为

通过进化算法训练分布式机器人群体算法以产生新兴行为，并在不同模式的操纵下进行了模拟实验和评估。

Sep, 2023

受环境影响的演化群体具有有限感知能力的集体行为出现

本文研究了机器人群体控制器的设计，并探索了一种进化方法来缓解人类开发者对控制器细节和群体行为之间联系的困难。使用微分进化来发展神经网络控制器，实现机器人遵循环境特征的梯度并解决任务。研究表明，进化所得解决方案在控制较差的情况下具有最大的灵活性，而有一个群体规模的 “甜蜜点”，同时观察到群体的集体运动，展示了真正的新兴行为，这是进化过程中未被代表和选择的。

Mar, 2022

适应不同觅食环境的人工学习智能体群行为发展

应用投影模拟和强化学习方法研究了人工智能智能体在收集资源过程中不同集体运动模式和个体运动趋势

Apr, 2020

从群体视频观测中提取可理解控制器

我们开发了一种方法，可以从视频演示中自动提取可理解的群体控制器，该方法使用进化算法根据比较高级别群体度量值的适应函数提取许多控制器，在收集运动任务中，并提供不同树导致的不同行为的定性分析，这是实现基于观察的群控器自动提取的第一步。

Sep, 2022

进化异质群体中专业集体行为的形成

通过表型可塑性在模拟机器人群体中研究专门化的集体行为的出现，并设计了一种在线调节机制来增强整体性能和可扩展性。

Feb, 2024

演进 AI 集体以增强人类多样性和实现自我调节功能

大型语言模型根据其他人生成的文本来引导它们的行为。这种能力以及它们在在线环境中越来越普遍的存在预示着它们将有意或无意地 “编程” 彼此并形成新兴的人工智能主体性、关系和集体。在这里，我们呼吁研究界调查这些互动人工智能的 “类社会” 属性，以增加它们对人类社会和在线环境健康的回报并减少风险。我们使用一个简单的模型及其输出来说明这样的新兴分散型人工智能集体如何扩大人类多样性范围并降低在线毒性和反社交行为的风险。最后，我们讨论了人工智能自我调节的机会，并解决了与创建和维护分散型人工智能集体相关的道德问题和设计挑战。

Feb, 2024

Turing 学习：一种基于度量无关的推断行为方法及其在群体中的应用

通过 Turing Learning 可以同时对自然或人工系统进行建模并进行行为推断，可以更准确地推断系统的行为，并适用于模型已知的系统以及模型未知的系统。

Mar, 2016

基于新颖的仿鱼自适应方法和神经动力学模型的智能群体逃逸的群体逃逸的智能群体逃逸

提出了一种新的受鱼群启发的自适应方法，用于群体逃生的群体机器人，通过吸引和排斥力结合生成无碰撞逃生机器人轨迹的生物启发式神经网络。模拟和实验结果表明，与鱼类逃避机动类似，该群体机器人能够集体离开威胁，所提出的方法在系统性能的效果和效率以及复杂环境中的灵活性和鲁棒性方面能够显著提高。

Feb, 2024

HERD: 持续人机进化的学习人类示范方法

本论文介绍了如何通过微进化强化学习的方法，将人类操作技能转移到商业机器人上，同时提出了多维进化路径搜索算法以及专家人类代理政策的转移，通过实验验证了该框架的有效性。

Dec, 2022