ICLROct, 2016

EPOpt: 使用模型集成学习稳健的神经网络策略

TL;DR通过采用一种集成学习算法和源域适应方法,EPOpt 算法试图克服用深度神经网络等丰富函数逼近器学习现实任务策略时遇到的复杂度和安全等难点,并能够学习到更健壮和更好的广义目标领域策略。