Jun, 2022

元学习参数化技能

TL;DR本研究提出了一种新的参数化技能学习算法,此算法可以学习可转移的参数化技能并将其综合到新的行动空间中,从而支持长视深远任务的高效学习。经实证表明,这种方法可以使代理人解决一组困难的长视深远任务。