Nov, 2022

Powderworld: 通过丰富的任务分布了解泛化的平台

TL;DR本研究自主研发了一款轻量级 GPU 仿真环境 Powderworld,提供多样化的任务空间,旨在通过提供源自相同核心规则的多样化任务来支持对泛化扩展的研究,实验证明增加环境复杂性可改善世界模型和某些强化学习代理的泛化,但可能会抑制高方差环境下的学习。