Nov, 2022

基于神经进化的强化学习质量多样性算法基准测试

TL;DR本文提出了一个深度神经进化强化学习机器人控制的质量多样性基准套件,包括任务,环境,行为描述符和适应性。基准使用标准的质量多样性指标,优势和档案概要指标来量化覆盖和适应度之间的关系,同时介绍了相对于环境随机性的解决方案的健壮性度量方式。我们相信本基准是一个有价值的工具,可以用于比较和改进研究结果。