NIPSNov, 2017

学习技能组合

TL;DR该研究提出了一种可微分的框架,能够学习一种称之为技能的简单策略的广泛组合。通过不断地递归地将技能与自身组合,我们可以创建表现出复杂行为的层次结构。实验结果表明,该架构可以快速从简单技能中构建复杂技能,并对看似没有联系的技能组合进行零 Shot 泛化。