BriefGPT.xyz
大模型
Ask
alpha
关键词
partially observable states
搜索结果 - 2
使用深度强化学习玩射击游戏
本研究提出了一种融合游戏特征信息的深度强化学习神经网络模型,其能够在处理 3D FPS 游戏的部分可观察状态下显著提高训练效率和性能。
PDF
8 years ago
循环强化学习:一种混合方法
本文研究了一种深度学习方法,将强化学习和监督学习结合,通过长短时记忆网络对隐藏状态的表示进行学习,在部分可观测任务中表现出了很好的性能。
PDF
9 years ago
Prev
Next