Mar, 2023

基于 MAP-Elites 的多样化 RL 智能体群体进化

TL;DR本文介绍了一个灵活的框架,该框架允许使用任何强化学习(RL)算法,并通过演化代理人群体而不仅仅是策略来缓解限制,以改进 QD 在机器人控制问题中的应用。