TorchBeast:分布式强化学习的PyTorch平台
简介:本文介绍了 rlpyt,该代码库通过单一存储库实现了所有深度强化学习算法,包括深度 Q-learning、策略梯度和 Q-value 策略梯度模型,使用 PyTorch 实现模块化。
Sep, 2019
SEED是一种现代可扩展强化学习代理程序,采用分布式算法IMPALA/V-trace和R2D2,可以在Atari-57、DeepMind Lab和Google Research Football上进行评估,并且比当前方法更具成本效益。
Oct, 2019
本文介绍了 Tianshou,这是一个高度模块化的 Python 库,使用 PyTorch 作为其后端,旨在提供灵活可靠的深度强化学习算法基础设施,支持在线和离线训练,具有统一接口,并通过 MuJoCo 环境的基准测试证明了其可靠性。
Jul, 2021
本文提出的Avalanche RL是一个用于Continual Reinforcement Learning的库,基于PyTorch,支持任何OpenAI Gym环境。我们还推出了Continual Habitat-Lab,其中包括一个新的基准和一个高级库,使得在photorealistic simulator Habitat-Sim上进行CRL研究成为可能。
Feb, 2022
pyRDDLGym是一个Python框架,可以通过RDDL描述自动生成OpenAI Gym的环境,支持模型知识以及多个实体和不同配置。它可以帮助强化学习领域快速开发新的基准,且便于基于交互式学习实现混合方法的研究。
Nov, 2022
介绍了TorchRL,一个通用控制库,用于处理决策和控制任务,支持Reinforcement Learning,基于PyTorch设计,提供完善的集成组件和独立组件的平衡。
Jun, 2023
本文提出了一种新的强化学习分布式系统ReaLly Scalable RL (SRL),其使用专门的数据流抽象来实现对不同应用的关联性规律的基础的通用培训,可实现大规模培训并获得了较高的性能。
Jun, 2023
近年来,游戏人工智能研究在使用强化学习方面取得了重要突破,然而现代桌面游戏的强化学习领域却鲜有关注,尽管相较于电子游戏,桌面游戏提供了一系列独特的挑战。为填补这一空白,我们引入了PyTAG,一个用于与Tabletop Games框架(TAG)交互的Python API。TAG框架涵盖了一系列超过20个现代桌面游戏,并提供了一种通用的AI代理API。我们提出了在这些游戏中训练强化学习代理的技术,并在对游戏子集进行Proximal Policy Optimisation算法训练后介绍了基准结果。最后,我们讨论了现代桌面游戏提供的独特挑战,通过PyTAG面向强化学习研究的现在也就随之开放。
Jul, 2023
此研究论文利用JAX实现的开源代码库JaxMARL,通过GPU加速以及更灵活的环境设计,提供了高效且全面的多智能体强化学习训练框架,有效应对了计算负担、样本复杂性等挑战。
Nov, 2023
利用两级分层框架 RL-GTP,在具备高效能 coding 能力的慢速代理和执行编码任务的快速代理之间无缝融合,以高效地处理涉及复杂逻辑和精确控制的实体任务,并取得了在 Minecraft 游戏中以及指定的 MineDojo 任务上的优越表现。
Feb, 2024