动态品质多样性搜索

Apr, 2024

Dynamic Quality-Diversity Search

Roberto Gallotta, Antonios Liapis, Georgios N. Yannakakis

TL;DR该论文介绍了一种新颖且通用的动态质量多样性 (Dynamic QD) 方法，旨在在环境发生变化的情况下更新过去解决方案的存档，并将其应用于进化搜索的动态环境。

Abstract

evolutionary search via the quality-diversity (QD) paradigm can discover highly performing solutions in different behavioural niches, showing considerable potential in complex real-world scenarios such as evolutionary robotics. Yet most QD methods only tackle static tasks that are fixe

evolutionary search quality-diversity paradigm dynamic environments dynamic qd methodology optimisation

发现论文，激发创造

评估优质多样性神经进化算法在难度较高的探索问题中的表现

本篇研究提出了三个基准测试，旨在通过质量多样性方法的系统性评估来解决控制问题和探索难题。

Nov, 2022

通过多样质量种群实现高效的质量多样性优化

本文提出了一种名为 Diverse Quality Species (DQS) 的新型质量 - 多样性算法，能够在不需要存档或事先定义行为范围的情况下，将解决方案分解为独立进化种类，并利用无监督技能发现来学习多样化而高性能的解决方案，在多个仿真机器人环境中进行评估，结果表明 DQS 比其他 QD 算法更具样本效率和性能。

Apr, 2023

动态感知的多样性优化：高效学习技能库

通过使用动态模型来提高质量 - 多样性算法的样本效率，我们提出了动态感知质量 - 多样性 (DA-QD) 框架；我们从中获得的经验进行增量训练，可以在想象力中使用想象技能库进行质量 - 多样性探索。该方法能够在三个机器人实验中取得成功的应用，包括比现有 QD 方法更高效的技能发现、零 - shot 学习中的新技能库以及长期导航任务中的损伤适应。

Sep, 2021

通过质量多样性实现程序化内容生成

Quality-diversity algorithms, with explicit behavior metrics searching for a set of high-quality and diverse solutions, provide new opportunities for AI game-playing and procedural content generation, enabling creative human-AI interactions and adaptivity.

Jul, 2019

通过动态感知和无重置学习在物理机器人上实现质量多样性优化

通过 Reset-Free QD 算法和动力学模型，在物理机器人上直接学习控制器，以提高样本效率和生成最佳存档，从而使物理四足机器人在两小时内学习到行为技能库。

Apr, 2023

质量和多样性优化：一个统一的模块化框架

本文提出了一个全面的质量多样性优化算法统一框架，探讨了该算法族群的大量变体，并提出了一种新的集合管理机制解决了在使用无结构的集合时观察到的侵蚀问题，同时还提出了使用质量多样性优化算法的新的选择机制，其性能比本文测试的所有算法都要好，这三个贡献都得到了质量多样化算法在三个不同实验场景下的广泛实验比较的支持。

May, 2017

基于质量多样性优化的无监督行为发现

该论文介绍了一种使用减少维度技术自动学习行为描述符的算法，可用于生成覆盖机器人大多数可能行为的控制器集合，其表现类似于传统的手动编码方法，但不需要提供任何手动编码的行为描述符。

Jun, 2021

通过无重置多样性优化实现自主步行学习

本研究提出了 Reset-Free Quality-Diversity optimization (RF-QD) 算法来实现具有多样性和高性能技能的行为副本的自主学习，我们在 Dynamics-Aware Quality-Diversity (DA-QD) 基础上引入了一种行为选择策略，并演示了通过训练自我重置的步态行走任务，可以高效学习到具有多样性和一定安全性的行走技能。

Apr, 2022

稀疏奖励和稀疏互动下的质量多样性：机器人抓取的应用

通过评估框架，该研究工作在 10 个不同抓取领域进行了 15 种方法的实验，结果显示优先选择成功解决方案的 MAP-Elites 变体在所研究的指标上大大优于其他方法，并发现稀疏交互可能导致迷惑性的新颖性，此工作在文献中具有创新性地有效产生了抓取轨迹示例，这方面没有先例。

Aug, 2023

基于 MAP-Elites 的多样化 RL 智能体群体进化

本文介绍了一个灵活的框架，该框架允许使用任何强化学习（RL）算法，并通过演化代理人群体而不仅仅是策略来缓解限制，以改进 QD 在机器人控制问题中的应用。

Mar, 2023