PettingZoo: 多智能体强化学习的 Gym
Aquarium 是一个开源的、全面的多智能体强化学习环境,旨在研究捕食者 - 被捕食者交互中的自发行为。该环境使用 PettingZoo 框架和 PPO 算法实现了资源高效的可视化,并证实了参数共享在提高协调性和样本效率方面优于个体学习。
Jan, 2024
本文介绍了 Atari Zoo 框架,其中包含了许多经过训练的深度强化学习算法在 Atari 游戏中的表现,并提供了易于使用的程序代码来加载、可视化和分析这些模型,以便进行深度强化学习算法的性能和表现方面的比较和研究。
Dec, 2018
本研究提出了一种进化人口课程学习模式 (EPC),以解决在多智能体游戏中训练大型人口的问题,采用进化方式解决利益不一致问题和保留每个阶段的多个智能体组以优化其适应性。并将 EPC 应用于 MADDPG 算法中,实验结果表明本方法在多智能体增长的情况下能够始终优于基准算法。
Mar, 2020
通过 EduGym 这一套教育性的强化学习环境和配套的交互式笔记本,该研究旨在帮助学生更好地理解强化学习的概念和实践,通过提供特定挑战方面的环境和解决方案,从而提高教学效果。
Nov, 2023
本文介绍了 panda-gym,它是集成了 OpenAI Gym 的 Franka Emika Panda 机器人的强化学习(RL)环境。它包括五个任务:到达,推动,滑动,拾取和堆叠。它们都遵循多目标 RL 框架,允许使用面向目标的 RL 算法。 panda-gym 是开源的,并且基于最新的无模型离策略算法。
Jun, 2021
为了推动我们对动物能力与人工智能系统能力之间的理解,我们引入了一个包含多样化的宠物自我运动图像和多智能体互动的数据集。该数据集与现有的人类或车辆自我中心数据集形成鲜明对比,定义了捕捉动物行为的两个基准任务,并通过与先前数据集相比,证明从 EgoPet 训练的模型表现更好,作为机器四足动作预训练资源的实用性。
Apr, 2024
AI agents are leaving the lab and entering the real world, and the paper introduces NovelGym, a platform for benchmarking reinforcement learning and hybrid planning and learning agents in open-world contexts.
Jan, 2024
SoftZoo 是一个理解软体机器人内在设计和性能权衡的全面虚拟平台,支持多种环境和任务,提供不同 iable 的设计表示和协同设计算法的基准测试,可用于开发和设计软体机器人的行为和形态智能。
Mar, 2023
动物人工智能环境是一个独特的基于游戏的研究平台,为人工智能和认知科学研究社区提供服务。本文介绍了 Animal-AI 3,该环境的最新版本,概述了使游戏对人类更具吸引力、对人工智能系统更复杂的几个重要新功能。
Dec, 2023
SocialGym 2 是一个用于社交机器人研究的多智能体导航模拟器,它采用多智能体强化学习技术,以实现多个装备有不同动态限制的机器人在复杂环境中的最优导航策略,并提供各种社交导航指标的测试。
Mar, 2023