BriefGPT.xyz
Ask
alpha
关键词
exploration tasks
搜索结果 - 3
神经启发的碎片化和回忆:解决好奇心中的灾难性遗忘
在大型环境中,深度强化学习方法在多个任务上表现出色,但在具有稀疏奖励的困难探索任务上仍然面临困难。本研究发现基于预测的内在奖励方法可能出现灾难性遗忘,并提出了一种名为 FARCuriosity 的新方法,通过碎片化和回溯来减轻灾难性遗忘问题
→
PDF
8 months ago
自主机器人群体行为优化贡献
本论文研究了集体机器人领域,特别是在探索、路径规划和协调等方面的多机器人系统的优化问题,并提出了一种基于蝴蝶优化算法和新的仿真框架的解决方案。
PDF
a year ago
从单次演示中学习 Montezuma's Revenge
提出了一种新的利用单一示范来学习解决 Montezuma's Revenge 等复杂探索任务的方法,该方法通过最大化奖励来训练代理,缩短了学习时间,降低了任务复杂度。
PDF
6 years ago
Prev
Next