PyTAG：用于多智能体强化学习的桌面游戏

May, 2024

PyTAG：用于多智能体强化学习的桌面游戏

PyTAG: Tabletop Games for Multi-Agent Reinforcement Learning

Martin Balla, George E.M. Long, James Goodman, Raluca D. Gaina, Diego Perez-Liebana

TL;DR本研究提出了 PyTAG 框架，支持与桌面游戏接口的互动，并探讨了桌面游戏对多智能体强化学习所带来的挑战和研究机会。通过在 PyTAG 上进行自我对弈训练，我们使用近端策略优化算法训练了模型，在一部分游戏上评估了训练得到的策略与某些简单智能体以及 Monte-Carlo Tree Search 的差异。

Abstract

Modern tabletop games present various interesting challenges for Multi-agent Reinforcement Learning. In this paper, we introduce pytag, a new framework that supports interacting with a large collection of games i

tabletop games multi-agent reinforcement learning pytag game-playing agent proximal policy optimisation

发现论文，激发创造

PyTAG：桌面游戏中强化学习的挑战与机遇

近年来，游戏人工智能研究在使用强化学习方面取得了重要突破，然而现代桌面游戏的强化学习领域却鲜有关注，尽管相较于电子游戏，桌面游戏提供了一系列独特的挑战。为填补这一空白，我们引入了 PyTAG，一个用于与 Tabletop Games 框架（TAG）交互的 Python API。TAG 框架涵盖了一系列超过 20 个现代桌面游戏，并提供了一种通用的 AI 代理 API。我们提出了在这些游戏中训练强化学习代理的技术，并在对游戏子集进行 Proximal Policy Optimisation 算法训练后介绍了基准结果。最后，我们讨论了现代桌面游戏提供的独特挑战，通过 PyTAG 面向强化学习研究的现在也就随之开放。

Jul, 2023

基于图形的深度强化学习玩文本冒险游戏

本文介绍了一种基于深度强化学习的架构，将游戏状态表示为知识图谱，通过剪枝动作空间和转移学习等技术实现了更高效的探索和学习，通过测试表明，此技术可在 TextWorld 平台上更快地学习控制策略。

Dec, 2018

基于文本游戏的深度强化学习智能体分析

在这篇论文中，我们构建了一个标准的无人工规则的基于文本的游戏智能体，在此环境中研究了代理设计、深度学习、评估类型和标准化等问题。

Sep, 2022

在多智能体环境中开发、评估和扩展学习智能体

DeepMind 的 “博弈论与多智能体团队” 研究了多智能体学习的多个方面，旨在使用深度强化学习探索复杂环境下的多智能体系统，并使用这些基准来推进我们的理解；本文总结了他们最近的工作并提出了一项分类，突显了多智能体研究中许多重要的开放性挑战。

Sep, 2022

多任务强化学习中的层次和可解释技能获取

本文提出了一种用于有效的多任务强化学习的新框架，该框架可以训练代理人使用分层策略，决定何时使用先前学习的策略和何时学习新技能。该方法通过给代理人提供随机时间语法来帮助代理人学习分层策略中必要的复杂时间依赖关系，并在 Minecraft 游戏中进行了验证。

Dec, 2017

多智能体交互的深度强化学习

本文概述了自主智能体的研究领域和目标，围绕多智能体强化学习、协作、与其他自主智能体的互动、基于内部动机的学习、课程学习等问题提出了自主智能体的开放性问题。

Aug, 2022

多阶段策略卡牌游戏的两阶段强化学习

这项研究介绍了一种针对《魔戒卡牌游戏》的两阶段强化学习策略，采用分阶段学习方法，通过在简化版本和完整的游戏环境中逐步学习，显著提高了人工智能代理在面对《魔戒卡牌游戏》的不可预测和具有挑战性的情境中的适应能力和表现。此外，论文还探讨了多智能体系统，其中不同的强化学习代理用于游戏的各个决策方面，并在一组 10,000 局随机游戏中实现了 78.5％的胜率提升。

Nov, 2023

通过分层强化学习在基于文本的游戏中实现泛化

本文介绍了一种基于知识图谱的 RL 代理的层次化框架，通过在高层次执行元策略将整个游戏分解为一组由文本目标指定的子任务，并通过知识图谱选择其中一个，然后在低层次执行子策略进行目标条件强化学习，实验结果表明，所提出的方法具有较好的泛化性能。

Sep, 2021

感知世界：针对基于文本游戏的问题引导强化学习

本研究探讨了深度强化学习在文本游戏中的应用，提出了通过引入知觉模块以及使用两阶段训练框架来提高样本效率，从而解决了应用 DRL 的两个主要挑战。实验结果表明，提出的方法显着提高了性能和样本效率，并且对复合错误和数据有限的预训练表现出鲁棒性。

Mar, 2022

关于团队运动比赛中的多智能体学习

本文提出了一种分层训练智能体的方法，以期在团队运动游戏中实现类似于人类的风格和高水平的表现，初步结果显示所提出的方法具有解决多智能体学习问题的潜力。

Jun, 2019