Dec, 2018

CompILE: 组合模仿学习与执行

TL;DR本文提出了一种名为CompILE的方法,通过无监督可微分序列分段模块学习顺序数据的潜在编码,从数据中学习可重复使用的,可变长度的分层行为,该模型通过分解潜在编码空间分离策略和分离策略的角色,能够学习连续的控制任务并在缺少任务特定策略时表现较优。