Feb, 2020

机器与人类交替学习

TL;DR本文提出一种具有自适应性的算法,使得现有的强化学习代理可以在机器和人类代理之间进行控制转换,在类似环境中可以找到多个转换策略序列,并演示了该算法在半自动驾驶场景中具有优越性。