BriefGPT.xyz
Ask
alpha
关键词
combinatorially-large text-based action spaces
搜索结果 - 1
ICLR
自然语言动作空间的图形约束强化学习
本文介绍了 KG-A2C 代理,它通过构建动态知识图谱并使用基于模板的行动空间来生成动作,解决了在大规模组合自然语言行动空间中扩展强化学习代理以应对自然语言理解、部分可观察性和行动生成挑战的问题;从广泛的 IF 游戏结果来看,KG-A2C
→
PDF
4 years ago
Prev
Next