Feb, 2018

多目标强化学习:挑战机器人环境与研究请求

TL;DR介绍了一组具有挑战性的连续控制任务,并提出了许多改进强化学习算法的研究思路。