Jun, 2020

通过价值分歧进行自动课程学习

TL;DR通过提出自动课程设计和目标建议模块,来提高强化学习中的多任务目标采样效率,并在机器人和导航任务中展示了比现有方法更好的性能。