Jun, 2024

XLand-100B:大规模多任务数据集用于背景强化学习

TL;DR通过构建 XLand-100B 数据集,该研究致力于解决在大规模环境中进行上下文强化学习时所面临的挑战,为进一步扩展和民主化该领域的研究提供坚实的基础。