NIPSJan, 2017

基于人机互动的智能体无关强化学习

TL;DR本论文探讨了一种 agent-agnostic 模式的 Human-in-the-Loop 强化学习教学方案,以期将人类教师的有益特性融入强化学习中,同时试验了在简单领域中应用 action pruning、reward shaping 和 training in simulation 等已有方法并将其表现为本模式的特例。