Craftium: 一个可扩展的用于创建强化学习环境的框架
本论文提出了 CaiRL 环境工具包作为一种有效、兼容性良好、可持续性更高的训练学习代理的替代方法,并提出了更高效环境模拟的方法,以解决当前强化学习工具包效率低下的问题。
Oct, 2022
该研究提供了一个基于 Open AI Gym 模板的高度可定制和开源的 RL 环境,ChemGymRL,以支持在化学发现中训练 RL 代理,通过使用一系列互连的虚拟化学试验台。研究介绍了这些试验台,并在其中训练了一组标准 RL 算法,最后提供了多个标准 RL 方法的性能讨论和比较以及未来工作的发展方向列表作为 ChemGymRL 的远景。
May, 2023
MiniHack 是一个强大的沙箱框架,用于设计新的深度强化学习(RL)测试环境,其中包含了丰富和复杂的以网格为基础的游戏 NetHack 的所有实体和环境动态,MiniHack 可以使用人类可读的描述语言或简单的 Python 接口来轻松地设计新的 RL 测试环境或整合现有的 RL 基准测试。
Sep, 2021
本文介绍了一种从自由形式文本提示中生成功能性 3D 物品的方法,该方法使用量化的神经辐射场(NeRFs)来表示这些物品,以在游戏中与给定文本描述相匹配。
Apr, 2024
Gymnasium 是一个开源库,提供了一个强化学习环境的 API,其主要作用是为基准环境和训练算法之间的广义互操作性提供了一个中心抽象。Gymnasium 配备了各种内置环境和实用工具,以简化研究人员的工作,并受到大多数训练库的支持。本文概述了 Gymnasium 的主要设计决策、其关键特性以及与其他 API 的区别。
Jul, 2024
CityCraft 是一种创新框架,结合了三个关键阶段来增强城市场景的多样性和质量,它包括使用扩散变压器模型生成 2D 城市布局,利用大型语言模型根据用户提示和语言指南制定土地利用规划,以及通过资产检索模块和 Blender 进行精确的资产放置和场景构建。CityCraft 在生成逼真的 3D 城市方面取得了最先进的性能。
Jun, 2024
综述并评估了九种常用的模拟引擎和框架在强化学习研究中的应用情况,重点讨论了选择和使用物理引擎时的挑战,并强调了 MuJoCo 作为领先框架的优势和灵活性,以及 Unity 使用的易用性和可伸缩性问题。该研究呼吁进一步发展以改善模拟引擎的可用性和性能,并强调了在强化学习研究中透明性和可复现性的重要性。
Jul, 2024
介绍了 Minigrid 和 Miniworld 库,它们提供了一套目标导向的 2D 和 3D 环境,旨在让用户快速开发出适用于各种研究需求的新环境,两个库都被 RL 社区广泛采用,促进了在广泛领域内的研究。通过案例研究展示了 Minigrid 和 Miniworld 统一 API 带来的额外功能,并且该论文介绍了它们的设计哲学、环境细节和世界生成 API。
Jun, 2023
GANcraft 是一种用于生成 Minecraft 等大型三维方块世界的逼真图像的非监督神经渲染框架,该方法采用语义块世界作为输入,并通过伪标签和对抗训练技术进行训练,不需要实际图像作为训练集,从而实现了视角一致的逼真图像渲染,以及用户对场景语义和样式的控制。
Apr, 2021
文章介绍了一种名为 Crafter 的开放世界生存游戏,可评估智能代理的广泛能力,并通过提供的奖励信号或内在目标进行学习和评估,以使代理成功解锁所有成就需要强大的泛化、深入探索和长期推理。
Sep, 2021