基于相关性引导的无监督质量多样性算法能力发现

Apr, 2022

基于相关性引导的无监督质量多样性算法能力发现

Relevance-guided Unsupervised Discovery of Abilities with Quality-Diversity Algorithms

Luca Grillotti, Antoine Cully

TL;DR提出了一种基于 Relevance-guided Unsupervised Discovery of Abilities 的 Quality-Diversity 算法，可以自动发现适用于任务的行为描述符，并在模拟机器人环境中验证了算法的有效性。

Abstract

quality-diversity algorithms provide efficient mechanisms to generate large collections of diverse and high-performing solutions, which have shown to be instrumental for solving downstream tasks. However, most of those algorithms rely on a →

quality-diversity algorithms behavioural descriptor relevance-guided unsupervised discovery of abilities robotic environment autonomous discovery

发现论文，激发创造

基于质量多样性优化的无监督行为发现

该论文介绍了一种使用减少维度技术自动学习行为描述符的算法，可用于生成覆盖机器人大多数可能行为的控制器集合，其表现类似于传统的手动编码方法，但不需要提供任何手动编码的行为描述符。

Jun, 2021

基于质量多样性与无监督描述符的自主技能发现

本文提出一种将 Quality-Diversity 优化算法与非监督降维算法相结合来自动定义行为描述符的方法，此方法可用于机器人学习行为库并在与环境交互时自主发现其能力范围，通过实验结果表明，该方法优于已有的非监督方法，机器人学习到的行为丰富多样。

May, 2019

从完整状态轨迹中发现无监督行为

本文介绍了一种利用自主生成的行为特征描述模拟机器人环境中任务的质量 - 多样性（Quality-Diversity）算法，可以自主发现各种解决方案来处理导航、高速前进和半滚动任务。

Nov, 2022

通过无重置多样性优化实现自主步行学习

本研究提出了 Reset-Free Quality-Diversity optimization (RF-QD) 算法来实现具有多样性和高性能技能的行为副本的自主学习，我们在 Dynamics-Aware Quality-Diversity (DA-QD) 基础上引入了一种行为选择策略，并演示了通过训练自我重置的步态行走任务，可以高效学习到具有多样性和一定安全性的行走技能。

Apr, 2022

动态感知的多样性优化：高效学习技能库

通过使用动态模型来提高质量 - 多样性算法的样本效率，我们提出了动态感知质量 - 多样性 (DA-QD) 框架；我们从中获得的经验进行增量训练，可以在想象力中使用想象技能库进行质量 - 多样性探索。该方法能够在三个机器人实验中取得成功的应用，包括比现有 QD 方法更高效的技能发现、零 - shot 学习中的新技能库以及长期导航任务中的损伤适应。

Sep, 2021

使用基于模型的品质多样性和梯度的高效探索

本文介绍了一种基于模型的 Quality-Diversity 算法，该算法通过对所有群体成员进行有效的探索和利用想象中的扰动来同时维持性能和高效的多样性，从而提高人群算法在具有欺骗性奖励的任务中的样本效率和解决方案质量。

Nov, 2022

通过质量多样性实现程序化内容生成

Quality-diversity algorithms, with explicit behavior metrics searching for a set of high-quality and diverse solutions, provide new opportunities for AI game-playing and procedural content generation, enabling creative human-AI interactions and adaptivity.

Jul, 2019

具有分层品质多样性的物理机器人在线损伤恢复

使用 Hierarchical Trial and Error 算法，将 QD 算法分层结构化以增加机器人学习技能的多样性，并使机器人能够更快地适应物理世界，实验表明，该方法优于现有基准算法，可提高机器人迎接新挑战的能力。

Oct, 2022

通过多样质量种群实现高效的质量多样性优化

本文提出了一种名为 Diverse Quality Species (DQS) 的新型质量 - 多样性算法，能够在不需要存档或事先定义行为范围的情况下，将解决方案分解为独立进化种类，并利用无监督技能发现来学习多样化而高性能的解决方案，在多个仿真机器人环境中进行评估，结果表明 DQS 比其他 QD 算法更具样本效率和性能。

Apr, 2023

评估优质多样性神经进化算法在难度较高的探索问题中的表现

本篇研究提出了三个基准测试，旨在通过质量多样性方法的系统性评估来解决控制问题和探索难题。

Nov, 2022