Dec, 2023

大型部分可观察环境中的顺序计划引导 LLMs

TL;DR通过结合状态空间搜索和基于自然语言模型的查询,我们提出了一种混合代理方法 neoplanner,以最大化状态值的上界来平衡探索和开发,并通过查询自然语言模型以生成行动计划,进一步提高了大规模状态空间和行动空间的顺序规划的性能。