Oct, 2022

通过发现多样化的环境轨迹生成器先验知识高效学习运动技能

TL;DR本文提出了一种使用 Quality-Diversity 算法学习多样化的专业动作先验的方法,称为进化环境轨迹生成器 (EETG),并在一种名为 PMTG 的系统结构中维护单一策略,在测试中成功地通过不同的环境。