Dec, 2022

状态空间闭合:通过强化学习重新审视无尽在线关卡生成

TL;DR通过提出状态空间封闭的概念,基于经验驱动的强化学习算法生成的内容可以在有限次数的状态下无限生成,且质量不受影响。然而,由于少量的状态空间导致其内容较缺乏多样性,需要进一步解决多样性问题。