PettingZoo: 多智能体强化学习的 Gym

Sep, 2020

PettingZoo: Gym for Multi-Agent Reinforcement Learning

J. K. Terry, Benjamin Black, Nathaniel Grammel, Mario Jayakumar, Ananth Hari...

TL;DR介绍 PettingZoo 动物园库及附带的代理环境循环（“AEC”）游戏模型，PettingZoo 是多样的多代理环境的库，有一个通用的 Python API，用于加速多智能体强化学习（“MARL”）研究。

Abstract

This paper introduces the pettingzoo library and the accompanying Agent Environment Cycle ("AEC") games model. pettingzoo is a library of diverse sets of →

pettingzoo multi-agent environments marl aec games model python api

发现论文，激发创造

水族馆：通过多智能体强化学习算法探索捕食者 - 猎物动态的综合框架

Aquarium 是一个开源的、全面的多智能体强化学习环境，旨在研究捕食者 - 被捕食者交互中的自发行为。该环境使用 PettingZoo 框架和 PPO 算法实现了资源高效的可视化，并证实了参数共享在提高协调性和样本效率方面优于个体学习。

Jan, 2024

Atari 模型动物园：深度强化学习代理的分析、可视化和比较

本文介绍了 Atari Zoo 框架，其中包含了许多经过训练的深度强化学习算法在 Atari 游戏中的表现，并提供了易于使用的程序代码来加载、可视化和分析这些模型，以便进行深度强化学习算法的性能和表现方面的比较和研究。

Dec, 2018

演化种群课程用于多智能体强化学习的扩展

本研究提出了一种进化人口课程学习模式 (EPC)，以解决在多智能体游戏中训练大型人口的问题，采用进化方式解决利益不一致问题和保留每个阶段的多个智能体组以优化其适应性。并将 EPC 应用于 MADDPG 算法中，实验结果表明本方法在多智能体增长的情况下能够始终优于基准算法。

Mar, 2020

EduGym：强化学习教育环境套件

通过 EduGym 这一套教育性的强化学习环境和配套的交互式笔记本，该研究旨在帮助学生更好地理解强化学习的概念和实践，通过提供特定挑战方面的环境和解决方案，从而提高教学效果。

Nov, 2023

Panda-Gym：用于机器人学习中的开源目标感知环境

本文介绍了 panda-gym，它是集成了 OpenAI Gym 的 Franka Emika Panda 机器人的强化学习（RL）环境。它包括五个任务：到达，推动，滑动，拾取和堆叠。它们都遵循多目标 RL 框架，允许使用面向目标的 RL 算法。 panda-gym 是开源的，并且基于最新的无模型离策略算法。

Jun, 2021

EgoPet: 一种来自动物视角的自我运动和互动数据

为了推动我们对动物能力与人工智能系统能力之间的理解，我们引入了一个包含多样化的宠物自我运动图像和多智能体互动的数据集。该数据集与现有的人类或车辆自我中心数据集形成鲜明对比，定义了捕捉动物行为的两个基准任务，并通过与先前数据集相比，证明从 EgoPet 训练的模型表现更好，作为机器四足动作预训练资源的实用性。

Apr, 2024

NovelGym：面向开放世界的混合规划和学习智能体的灵活生态系统

AI agents are leaving the lab and entering the real world, and the paper introduces NovelGym, a platform for benchmarking reinforcement learning and hybrid planning and learning agents in open-world contexts.

Jan, 2024

SoftZoo: 一个软体机器人共设计基准，用于在多样化环境中进行运动

SoftZoo 是一个理解软体机器人内在设计和性能权衡的全面虚拟平台，支持多种环境和任务，提供不同 iable 的设计表示和协同设计算法的基准测试，可用于开发和设计软体机器人的行为和形态智能。

Mar, 2023

动物人工智能 3：新变化与重要性

动物人工智能环境是一个独特的基于游戏的研究平台，为人工智能和认知科学研究社区提供服务。本文介绍了 Animal-AI 3，该环境的最新版本，概述了使游戏对人类更具吸引力、对人工智能系统更复杂的几个重要新功能。

Dec, 2023

SOCIALGYM 2.0: 多智能体社交机器人在共享人类空间中导航模拟器

SocialGym 2 是一个用于社交机器人研究的多智能体导航模拟器，它采用多智能体强化学习技术，以实现多个装备有不同动态限制的机器人在复杂环境中的最优导航策略，并提供各种社交导航指标的测试。

Mar, 2023