NIPSJul, 2017
RAIL:风险厌恶模仿学习
RAIL: Risk-Averse Imitation Learning
Anirban Santara, Abhishek Naik, Balaraman Ravindran, Dipankar Das, Dheevatsa Mudigere...
TL;DR本文介绍了用于模仿学习的算法,其中 Generative Adversarial Imitation Learning (GAIL) 是当前的最先进算法,但是他们在一些关键领域比人类专家更容易出现失误。作者提出了一种新的 Risk-Averse Imitation Learning (RAIL) 算法以更好地解决这个问题。