TorchBeast：分布式强化学习的PyTorch平台

Oct, 2019

TorchBeast：分布式强化学习的PyTorch平台

TorchBeast: A PyTorch Platform for Distributed RL

HTML

PDF

Heinrich Küttler, Nantas Nardelli, Thibaut Lavril, Marco Selvatici, Viswanath Sivakumar...

TL;DRTorchBeast是一个基于PyTorch的强化学习（RL）研究平台，实现了一个快速、异步、并行的IMPALA算法，同时具有简单性，研究人员可以使用TorchBeast进行可扩展的RL研究。

Abstract

torchbeast is a platform for reinforcement learning (RL) research in pytorch. It implements a version of the popular →

发现论文，激发创造

rlpyt：基于PyTorch的深度强化学习研究代码库

简介：本文介绍了 rlpyt，该代码库通过单一存储库实现了所有深度强化学习算法，包括深度 Q-learning、策略梯度和 Q-value 策略梯度模型，使用 PyTorch 实现模块化。

Sep, 2019

SEED RL：可伸缩高效的深度强化学习与加速化的中心推理

SEED是一种现代可扩展强化学习代理程序，采用分布式算法IMPALA/V-trace和R2D2，可以在Atari-57、DeepMind Lab和Google Research Football上进行评估，并且比当前方法更具成本效益。

Oct, 2019

Tianshou: 一个高度模块化的深度强化学习库

本文介绍了 Tianshou，这是一个高度模块化的 Python 库，使用 PyTorch 作为其后端，旨在提供灵活可靠的深度强化学习算法基础设施，支持在线和离线训练，具有统一接口，并通过 MuJoCo 环境的基准测试证明了其可靠性。

Jul, 2021

Avalanche RL: 一个连续强化学习库

本文提出的Avalanche RL是一个用于Continual Reinforcement Learning的库，基于PyTorch，支持任何OpenAI Gym环境。我们还推出了Continual Habitat-Lab，其中包括一个新的基准和一个高级库，使得在photorealistic simulator Habitat-Sim上进行CRL研究成为可能。

Feb, 2022

从RDDL到Gym环境的pyRDDLGym

pyRDDLGym是一个Python框架，可以通过RDDL描述自动生成OpenAI Gym的环境，支持模型知识以及多个实体和不同配置。它可以帮助强化学习领域快速开发新的基准，且便于基于交互式学习实现混合方法的研究。

Nov, 2022

TorchRL：一个基于PyTorch的数据驱动决策库

介绍了TorchRL，一个通用控制库，用于处理决策和控制任务，支持Reinforcement Learning，基于PyTorch设计，提供完善的集成组件和独立组件的平衡。

Jun, 2023

SRL: 将分布式强化学习扩展到超过一万个核心

本文提出了一种新的强化学习分布式系统ReaLly Scalable RL (SRL)，其使用专门的数据流抽象来实现对不同应用的关联性规律的基础的通用培训，可实现大规模培训并获得了较高的性能。

Jun, 2023

PyTAG：桌面游戏中强化学习的挑战与机遇

近年来，游戏人工智能研究在使用强化学习方面取得了重要突破，然而现代桌面游戏的强化学习领域却鲜有关注，尽管相较于电子游戏，桌面游戏提供了一系列独特的挑战。为填补这一空白，我们引入了PyTAG，一个用于与Tabletop Games框架（TAG）交互的Python API。TAG框架涵盖了一系列超过20个现代桌面游戏，并提供了一种通用的AI代理API。我们提出了在这些游戏中训练强化学习代理的技术，并在对游戏子集进行Proximal Policy Optimisation算法训练后介绍了基准结果。最后，我们讨论了现代桌面游戏提供的独特挑战，通过PyTAG面向强化学习研究的现在也就随之开放。

Jul, 2023

JaxMARL：基于JAX的多智能体强化学习环境

此研究论文利用JAX实现的开源代码库JaxMARL，通过GPU加速以及更灵活的环境设计，提供了高效且全面的多智能体强化学习训练框架，有效应对了计算负担、样本复杂性等挑战。

Nov, 2023

RL-GPT: 集成强化学习和代码为策略

利用两级分层框架 RL-GTP，在具备高效能 coding 能力的慢速代理和执行编码任务的快速代理之间无缝融合，以高效地处理涉及复杂逻辑和精确控制的实体任务，并取得了在 Minecraft 游戏中以及指定的 MineDojo 任务上的优越表现。

Feb, 2024