ICLRFeb, 2021

任务不可知的形态进化

TL;DR本文介绍了一种新方法 TAME,可以通过对一些 agent 应用基本的随机动作,无需任务或奖励指定,通过一个信息理论追踪代理人的能力,解决目前协调形态和行为的策略优化方法需要昂贵的劳动力以及经常生成无法推广的特定任务的形态的问题,并通过实验证明 TAME 可以在 2D、3D 和操作环境中进化与任务监督算法学习的形态相匹配的形态。