BriefGPT.xyz
Ask
alpha
关键词
atari environments
搜索结果 - 6
深度强化学习中的可塑性注入
本文引入了塑性注入,一种最小化的干预手段,用于增加网络的可塑性,识别一类 Atari 游戏环境,提出了应对可塑性丧失的未来研究方向,并提供一种可改善强化学习训练效率的工具。塑性注入在 Atari 游戏方面的结果显示,与其他方法相比,在保持计
→
PDF
a year ago
DITTO: 带有全局模型的离线模仿学习
使用物理世界模型和在线强化学习,本文提出了一种 DITTO 的离线模仿学习算法,用于解决协变量转移的问题,并通过 Atari 游戏环境测试表明,在线学习性能已经达到了最先进水平。
PDF
a year ago
测量强化学习中的干预鲁棒性
本文提出了干预鲁棒性的概念,并开发了一种可量化的方法来测量它。通过对八个算法和三种 Atari 环境下的干预和状态进行计算,发现干预鲁棒性因算法类型和训练次数而异,高性能不一定意味着高干预鲁棒性。
PDF
2 years ago
最大化 Wasserstein 距离的内在控制
本文提出了一种通过最大化状态访问的 Wasserstein 距离学习最大化技能的代理奖励的方法,这种方法比基于多样性的目标导向策略在 MDP 中的覆盖范围更广, 并在各种 Atari 环境中验证了结果。
PDF
3 years ago
ICCV
基于注意力机制的 Atari 智能体自由午餐显著性
本文提出了一种新方法,通过添加自由午餐显著性(FLS)的注意力模块将其应用于深度学习代理在 Atari 环境中进行的训练,使网络产生注重分布。通过实验,我们发现网络的性能与基线类似,并且可以作为深度强化学习代理的可替代品。
PDF
5 years ago
生成对抗树搜索的惊人负面结果
本文研究了深度生成模型在强化学习环境中的设计,并提出了一种基于生成对抗树搜索和蒙特卡罗树搜索的算法 GATS。GATS 在学习环境模型后,在树搜索中实现了 MCTS,并使用深度 Q 网络学习 Q 函数。然而,实验结果表明,GATS 并未能超
→
PDF
6 years ago
Prev
Next