Jan, 2024

水族馆:通过多智能体强化学习算法探索捕食者 - 猎物动态的综合框架

TL;DRAquarium 是一个开源的、全面的多智能体强化学习环境,旨在研究捕食者 - 被捕食者交互中的自发行为。该环境使用 PettingZoo 框架和 PPO 算法实现了资源高效的可视化,并证实了参数共享在提高协调性和样本效率方面优于个体学习。