Mar, 2020

分层解耦模仿用于形态转移

TL;DR通过将策略分解为独立学习的底层策略和可转移的高层策略,以简化形态的机器人为源,提出了一种层次化的策略转移方法,通过激励底层策略的学习,从而大幅提高了零样本高层策略的可转移性。同时,采用KL正则化训练高层策略会稳定学习并防止模式崩溃,进一步在一系列公共环境中验证了该方法的适用性。