May, 2018

使用生成对抗模仿学习学习时间战略关系

TL;DR该论文提出了一个新的框架,用于自动学习人类决策中的复杂策略,通过使用两个外部存储模块来捕捉子任务和整个目标之间的关系,并将其用于自主驾驶汽车应用中检验其有效性。