Jun, 2018

混合匹配——强化学习智能体课程

TL;DRMix&Match是一个训练框架,它利用课程从更简单的代理中自动形成课程并逐渐训练更复杂的代理,相比于传统的课程学习方法,我们使用逐渐改变策略内部表征的过程,并在3D游戏、多任务等场景中取得了显著的性能提升。