ICMLMay, 2017
强化学习智能体自动生成目标
Automatic Goal Generation for Reinforcement Learning Agents
Carlos Florensa, David Held, Xinyang Geng, Pieter Abbeel
TL;DR提出了一种基于 Adversarial training 的方法,用于 Reinforcement learning 中任务发现的问题,可以实现在不需要任何先验环境知识的情况下,对多元化任务的高效自动学习,并且能够解决传统上存在的稀疏奖励问题。