BriefGPT.xyz
大模型
Ask
alpha
关键词
3d navigation
搜索结果 - 2
CCPT:基于好奇心条件近端轨迹的自动游戏测试和验证
本文提出了一种新型的深度强化学习算法,通过结合好奇心和仿真学习以训练智能代理,从而在复杂的三维导航环境中自动分析和检测游戏问题,并直接向游戏设计师总结其在游戏设计中的问题和设计疏忽。通过在全新的反映现代 AAA 视频游戏复杂性的三维导航环境
→
PDF
2 years ago
ICML
部分可观测深度强化学习的后悔最小化
本研究提出了一种新的基于反事实遗憾最小化的深度强化学习算法,能够有效处理部分观测状态,并在 Doom 和 Minecraft 中的学习第一人称的 3D 导航以及在 Doom 和 Pong 中进行部分观测对象的动作等强化学习任务中显著优于现有
→
PDF
7 years ago
Prev
Next