NIPSJul, 2017

RAIL:风险厌恶模仿学习

TL;DR本文介绍了用于模仿学习的算法,其中 Generative Adversarial Imitation Learning (GAIL) 是当前的最先进算法,但是他们在一些关键领域比人类专家更容易出现失误。作者提出了一种新的 Risk-Averse Imitation Learning (RAIL) 算法以更好地解决这个问题。