Jun, 2018

关系深度强化学习

TL;DR通过结构化感知和关系推理的方法,使用自我注意力来进行实体之间关系的迭代推理以及指导无模型策略的建立,提高了强化学习的效率、泛化能力和可解释性,并在 Box-World 任务和 StarCraft II Learning Environment 等方面取得了一定的进展。