BriefGPT.xyz
Ask
alpha
关键词
accumulated rewards
搜索结果 - 1
AAAI
应用于交互小说的深度强化学习算法改进
本文研究利用深度强化学习算法可玩具有组合性、稀疏奖励、有部分可观察性的文本游戏。提出了基于累积奖励的上下文化机制,缓解了部分可观测性,研究了可行动作的不同方法,并在一系列不同难度的文本游戏和 Zork 游戏中进行了实证研究,结果表明这些技术
→
PDF
5 years ago
Prev
Next