ICLRJan, 2020

自然语言动作空间的图形约束强化学习

TL;DR本文介绍了 KG-A2C 代理,它通过构建动态知识图谱并使用基于模板的行动空间来生成动作,解决了在大规模组合自然语言行动空间中扩展强化学习代理以应对自然语言理解、部分可观察性和行动生成挑战的问题;从广泛的 IF 游戏结果来看,KG-A2C 优于当前的 IF 代理,尽管行动空间尺寸呈指数级增长。