BriefGPT.xyz
Ask
alpha
关键词
text adventure games
搜索结果 - 2
ICLR
多阶段情节控制用于文本游戏中的战略性探索
该研究针对文本冒险类游戏过大动作空间和奖励稀疏的问题,通过多阶段方法的策略分解,提出了 eXploit-Then-eXplore (XTX) 算法,在确定性和随机场景下要比先前优化方案提高 27%和 11%的平均标准化分数,在特定的 Zor
→
PDF
3 years ago
使用知识图谱进行深度强化学习的迁移学习
该研究探讨了使用知识图谱作为域知识传输的表示来训练文本冒险游戏中的强化学习智能体的方法,测试其在多个游戏上的迁移学习能力,结果表明这种方法能够更快地学习高质量的控制策略。
PDF
5 years ago
Prev
Next