PCGRL+: 强化学习关卡生成的规模、控制与泛化

Aug, 2024

PCGRL+: 强化学习关卡生成的规模、控制与泛化

PCGRL+: Scaling, Control and Generalization in Reinforcement Learning Level Generators

Sam Earle, Zehua Jiang, Julian Togelius

TL;DR本研究解决了现有程序内容生成（PCGRL）面临的规模限制问题，通过在Jax中实现PCGRL环境，使得学习和模拟过程能够在GPU上并行运行，从而显著加快训练速度。研究表明，模型能够学习到更稳健的设计策略，并在超出训练数据的地图尺寸上表现出良好的泛化能力，这为设计师提供了更大的控制权。

Abstract

Procedural Content Generation via Reinforcement Learning (PCGRL) has been introduced as a means by which controllable designer agents can be trained based only on a set of computable metrics acting as a proxy for

发现论文，激发创造

通过程序化关卡生成，照亮深度强化学习的泛化问题

本文探讨了通过在训练中使用过程化生成的关卡如何增加模型的泛化性能，并研究了其与人类设计的关卡的关系。结果表明，通过降低难度、调整关卡设计，可以获得更好的性能表现，并进行了降维和聚类分析来评估关卡生成器的分布。

Jun, 2018

通过程序生成增加机器学习的通用性

研究了游戏中的Procedural Content Generation(PCG)对于增加机器学习方法的通用性的重要性，特别是学习算法对于过度拟合的困扰和参数随机化的抗拟合方法，以增加算法对于不同环境的适应性和回报。

Nov, 2019

利用程序生成技术评估强化学习

Procgen Benchmark 是一套16个生成环境的测试套件，旨在评估强化学习在样本效率和泛化性能方面的表现，为此提供了详细的实验协议，并经验证明多样性的环境分布是充分训练和评估 RL agent 的关键，从而促进了生成内容的广泛使用。我们使用此基准测试来研究模型大小的影响，并发现大型模型显著提高了样本效率和泛化性能。

Dec, 2019

基于强化学习的程序化内容生成(PCGRL)

研究如何使用强化学习训练级别设计代理，将关卡设计视为游戏并将内容生成器本身学习，并探讨了三种不同的转换二维层次设计问题的马尔可夫决策过程，将其应用于三个游戏环境中。

Jan, 2020

可控 3D 楼层生成器的学习

使用强化学习实现程序化内容生成（PCGRL），通过可计算、用户定义的质量度量训练智能体优化3D环境下针对Minecraft游戏的任务，生成多样化的游戏关卡，展示了PCGRL在3D环境下的应用和潜力。

Jun, 2022

通过强化学习平衡竞争双人游戏的难度级别

本文提出了一种基于PCGRL框架的自动平衡的方法，其架构包括三个部分：关卡生成器，平衡代理以及奖励模型仿真，并且使用新颖的基于交换的表示法，该方法能够比普通的PCGRL更好更快地教授代理修改关卡以进行平衡。

Jun, 2023

SRL: 将分布式强化学习扩展到超过一万个核心

本文提出了一种新的强化学习分布式系统ReaLly Scalable RL (SRL)，其使用专门的数据流抽象来实现对不同应用的关联性规律的基础的通用培训，可实现大规模培训并获得了较高的性能。

Jun, 2023

RL-ViGen：一种用于视觉泛化的强化学习基准

Visual Reinforcement Learning中的generalization问题是一个长期存在的挑战，该研究介绍了一个新的用于Visual Generalization的Reinforcement Learning基准测试框架（RL-ViGen），包含多样的任务和广泛的generalization类型，以便更可靠地评估agent的可视化generalization能力，并发现目前没有单一算法能够在所有任务中普遍占优势，旨在为未来创建适用于实际场景的通用视觉generalization RL agent奠定基础。

Jul, 2023

JaxMARL：基于JAX的多智能体强化学习环境

此研究论文利用JAX实现的开源代码库JaxMARL，通过GPU加速以及更灵活的环境设计，提供了高效且全面的多智能体强化学习训练框架，有效应对了计算负担、样本复杂性等挑战。

Nov, 2023

G-PCGRL：基于强化学习的程序化图数据生成

我们提出了一种使用强化学习进行图数据的程序化生成的新方法G-PCGRL，该方法能够快速可靠地生成基于图的内容，支持和激励游戏设计师在游戏创作过程中。

Jul, 2024