atari environments | BriefGPT

关键词atari environments

搜索结果 - 6

深度强化学习中的可塑性注入
本文引入了塑性注入，一种最小化的干预手段，用于增加网络的可塑性，识别一类 Atari 游戏环境，提出了应对可塑性丧失的未来研究方向，并提供一种可改善强化学习训练效率的工具。塑性注入在 Atari 游戏方面的结果显示，与其他方法相比，在保持计
PDFa year ago
DITTO: 带有全局模型的离线模仿学习
使用物理世界模型和在线强化学习，本文提出了一种 DITTO 的离线模仿学习算法，用于解决协变量转移的问题，并通过 Atari 游戏环境测试表明，在线学习性能已经达到了最先进水平。
PDFa year ago
测量强化学习中的干预鲁棒性
本文提出了干预鲁棒性的概念，并开发了一种可量化的方法来测量它。通过对八个算法和三种 Atari 环境下的干预和状态进行计算，发现干预鲁棒性因算法类型和训练次数而异，高性能不一定意味着高干预鲁棒性。
PDF2 years ago
最大化 Wasserstein 距离的内在控制
本文提出了一种通过最大化状态访问的 Wasserstein 距离学习最大化技能的代理奖励的方法，这种方法比基于多样性的目标导向策略在 MDP 中的覆盖范围更广，并在各种 Atari 环境中验证了结果。
PDF3 years ago
ICCV基于注意力机制的 Atari 智能体自由午餐显著性
本文提出了一种新方法，通过添加自由午餐显著性（FLS）的注意力模块将其应用于深度学习代理在 Atari 环境中进行的训练，使网络产生注重分布。通过实验，我们发现网络的性能与基线类似，并且可以作为深度强化学习代理的可替代品。
PDF5 years ago
生成对抗树搜索的惊人负面结果
本文研究了深度生成模型在强化学习环境中的设计，并提出了一种基于生成对抗树搜索和蒙特卡罗树搜索的算法 GATS。GATS 在学习环境模型后，在树搜索中实现了 MCTS，并使用深度 Q 网络学习 Q 函数。然而，实验结果表明，GATS 并未能超
PDF6 years ago