关键词quality-diversity optimization
搜索结果 - 6
- 质量多样性与描述条件增强学习的协同
DCG-MAP-Elites 在多个挑战性连续控制运动任务中实现与所有基线模型相当或更高的 QD 得分和覆盖率。
- 通过人类反馈实现多样性
通过人类反馈学习行为空间,结合适当的距离度量,提出了一种名为 DivHF 的通用方法,该方法能更好地符合人类要求,并在人类偏好下得到更多样化的解决方案。
- 多人合力:使用多个并行进化策略的 MAP-Elites 提升质量和多样性
本文提出了一种基于进化策略的快速并行评估,名为 MAP-Elites-Multi-ES(MEMES)的新型 QD 算法,该算法通过保持多个独立的进化策略线程来扩展现有的 MAP-Elites-ES 算法,并引入了一种新的动态重置过程来自主地 - 多目标质量多样性优化
本研究提出了一种新的多目标优化方法,将 MAP-Elites 算法中的多样性与多目标优化相结合,通过使用 Pareto Front 填充每个单元格,能够在描述符空间中提取多样性解,并在探索不同目标之间的折衷方案时提供全局性能优异的解决方案。
- 基于质量多样性与无监督描述符的自主技能发现
本文提出一种将 Quality-Diversity 优化算法与非监督降维算法相结合来自动定义行为描述符的方法,此方法可用于机器人学习行为库并在与环境交互时自主发现其能力范围,通过实验结果表明,该方法优于已有的非监督方法,机器人学习到的行为丰 - 质量和多样性优化:一个统一的模块化框架
本文提出了一个全面的质量多样性优化算法统一框架,探讨了该算法族群的大量变体,并提出了一种新的集合管理机制解决了在使用无结构的集合时观察到的侵蚀问题,同时还提出了使用质量多样性优化算法的新的选择机制,其性能比本文测试的所有算法都要好,这三个贡