Sep, 2019

学习具有行动嵌入的可转移动作策略

TL;DR本文提出了一种通过学习状态嵌入和动作嵌入来跨不同状态和动作空间传递策略的方法,实验结果表明该方法不仅可以学习有用的动作嵌入,而且可以加速策略学习。