May, 2024

PyTAG:用于多智能体强化学习的桌面游戏

TL;DR本研究提出了 PyTAG 框架,支持与桌面游戏接口的互动,并探讨了桌面游戏对多智能体强化学习所带来的挑战和研究机会。通过在 PyTAG 上进行自我对弈训练,我们使用近端策略优化算法训练了模型,在一部分游戏上评估了训练得到的策略与某些简单智能体以及 Monte-Carlo Tree Search 的差异。