Sep, 2019

元策略优化学习快速适应

TL;DR该研究使用元学习算法,利用潜在变量输入训练策略,实现快速适应新场景的机器人大腿行走能力,并在真实和模拟实验中证明了该方法在适应新任务方面优于之前的方法。