rlpyt：基于PyTorch的深度强化学习研究代码库

Sep, 2019

rlpyt：基于PyTorch的深度强化学习研究代码库

rlpyt: A Research Code Base for Deep Reinforcement Learning in PyTorch

Adam Stooke, Pieter Abbeel

TL;DR简介：本文介绍了 rlpyt，该代码库通过单一存储库实现了所有深度强化学习算法，包括深度 Q-learning、策略梯度和 Q-value 策略梯度模型，使用 PyTorch 实现模块化。

Abstract

Since the recent advent of deep reinforcement learning for game play and simulated robotic control, a multitude of new algorithms have flourished. Most are model-free algorithms which can be categorized into thre

发现论文，激发创造

RL$^2$: 快速增强学习通过慢增强学习

通过将强化学习算法RL^2表示为递归神经网络并从数据中学习，我们提出了一种方法来尝试理解替代动物的快速学习过程。我们在具有优化性能保证的情况下评估了RL^2的性能，并证明它适用于高维问题。

Nov, 2016

深度强化学习简介

介绍了深度强化学习的模型、算法和技术，着重讨论与泛化相关的方面以及深度强化学习在实际应用中的使用。

Nov, 2018

DeepSynth：深度强化学习中任务自动划分的自动机合成

DeepSynth是一种有效训练深度强化学习代理的方法，可在奖励稀疏和非Markovian的情况下实现，同时也需要实现未知的高级目标序列。该方法利用合成紧凑自动机的新算法自动发现这种序列结构，并使用环境的跟踪数据合成一个可解释的自动机，从而为控制策略的生成提供指导，并且相较于现有方法在Montezuma's Revenge等实验中在策略合成所需的迭代次数上获得了两个数量级的降低，同时也能显著提高可扩展性。

Nov, 2019

用深度强化学习训练机器人的方法：我们所学到的教训

本文评估了深度强化学习在现实世界机器人中的应用，包括学习知觉和运动等复杂技能的案例研究以及相关挑战。

Feb, 2021

离线强化学习综述：分类、评估与开放性问题

本论文提出一个在线学习和离线学习技术的归一化分类法，总结了离线RL领域的最新算法突破和现有基准的特性和不足，并提供了对未来研究方向的展望。

Mar, 2022

深度强化学习中的预训练调查

该论文系统地评估了目前深度强化学习领域中采用的预训练方法，提出了分类体系、讨论了各个方面，并关注了未来可能遇到的挑战和需要探索的方向。

Nov, 2022

TorchRL：一个基于PyTorch的数据驱动决策库

介绍了TorchRL，一个通用控制库，用于处理决策和控制任务，支持Reinforcement Learning，基于PyTorch设计，提供完善的集成组件和独立组件的平衡。

Jun, 2023

BackpropTools：一款快速便捷的深度强化学习库，用于连续控制

BackpropTools是一个用于深度监督和强化学习的C++库，能够在各种平台上高效地工作，其RL算法与模拟环境的紧密集成使得在微控制器上直接训练深度RL算法成为可能，这使得“微型强化学习(TinyRL)”领域初次呈现。

Jun, 2023

深度强化学习在机器人领域的应用：现实世界成功案例的综述

本研究解决了深度强化学习（DRL）在机器人应用时面临的复杂性和成本问题。通过对DRL在开发现代机器人能力方面成功案例的综合分析，揭示了其关键因素和未被充分探索的领域，并提出未来研究的方向，重点在于稳定高效的RL范式和整合多种能力的系统性方法。这项工作为RL从业者和机器人研究人员提供了重要的见解，帮助他们利用RL的优势开发更具能力的实际机器人系统。

Aug, 2024

深度强化学习中的高效探索：一种新颖的贝叶斯演员-评论家算法

本研究针对深度强化学习（DRL）中探索效率不足的问题，提出了一种新颖的贝叶斯演员-评论家算法，旨在提升环境的有效探索能力。通过理论研究和实证评估，证明该方法在标准基准和先进评估套件上的优越性，预计将为强化学习社区提供重要的工具和基础。

Aug, 2024