AAAIMay, 2018

基于偏好成本学习的任务转移

TL;DR本文提出了一个新的任务转移框架,通过专家偏好作为指导,无需明确的成本函数,随着增强的 Adversarial MaxEnt IRL,学习目标代价函数和轨迹分布,并通过选择结果生成更多的轨迹,实验证明了该方法的效果。