Feb, 2016

自适应技能、自适应分区(ASAP)

TL;DR介绍了自适应技能(ASAP)框架,它能够学习技能和如何应用技能,并能够通过适应其中应用现有学习技能的位置来解决相关新任务,同时证明了其在自然条件下收敛到局部最优解的能力,相关的 RoboCup 实验也表明了它学习如何重复利用技能以及用比每个任务都从头解决消耗的经验更少的能力来解决多个任务。