BriefGPT.xyz
Ask
alpha
关键词
admissible actions
搜索结果 - 2
语言模型作为零 - shot 规划器:提取行动知识用于具身代理
本文研究大型语言模型在互动环境中是否可以利用所学的世界知识来执行高层任务,并提出了一种条件方法,将语言模型生成的中级计划语义上翻译为合适的操作以提高执行性能。在 VirtualHome 环境中的实证评估结果表明,该方法在可执行性方面显著优于
→
PDF
2 years ago
AAAI
应用于交互小说的深度强化学习算法改进
本文研究利用深度强化学习算法可玩具有组合性、稀疏奖励、有部分可观察性的文本游戏。提出了基于累积奖励的上下文化机制,缓解了部分可观测性,研究了可行动作的不同方法,并在一系列不同难度的文本游戏和 Zork 游戏中进行了实证研究,结果表明这些技术
→
PDF
5 years ago
Prev
Next