Jun, 2021

基于质量多样性优化的无监督行为发现

TL;DR该论文介绍了一种使用减少维度技术自动学习行为描述符的算法,可用于生成覆盖机器人大多数可能行为的控制器集合,其表现类似于传统的手动编码方法,但不需要提供任何手动编码的行为描述符。