Aug, 2024

PCGRL+: 强化学习关卡生成的规模、控制与泛化

TL;DR本研究解决了现有程序内容生成(PCGRL)面临的规模限制问题,通过在Jax中实现PCGRL环境,使得学习和模拟过程能够在GPU上并行运行,从而显著加快训练速度。研究表明,模型能够学习到更稳健的设计策略,并在超出训练数据的地图尺寸上表现出良好的泛化能力,这为设计师提供了更大的控制权。