Acme：分布式强化学习研究框架

Jun, 2020

Acme: A Research Framework for Distributed Reinforcement Learning

Matthew W. Hoffman, Bobak Shahriari, John Aslanides, Gabriel Barth-Maron, Nikola Momchev...

TL;DR介绍了一种名为 Acme 的深度强化学习框架，该框架旨在构建简单、模块化的组件，以便在不同规模的执行中使用。其主要目标是为算法开发提供一个框架，同时也提供了重要或最先进算法的简单参考实现以提升强化学习研究的可重复性和基准。本文描述了 Acme 中的主要设计决策和该框架如何被用于实现各种算法的详细信息，同时对重要或最先进算法进行了基线实验，并展示了如何将这些算法扩展到更大和更复杂的环境中。

Abstract

deep reinforcement learning (RL) has led to many recent and groundbreaking advances. However, these advances have often come at the cost of both increased scale in the underlying architectures being trained as well as increased complexity of the RL algorithms used to train them. These

deep reinforcement learning acme modularity reproducibility algorithm development

发现论文，激发创造

分布式多智能体强化学习研究框架 Mava

本文介绍了一种名为 Mava 的研究框架，它专门为构建可扩展的多智能体 RL 系统而设计。Mava 提供了有用的组件，抽象层，实用工具和通信模块，使得相应算法更容易复现和扩展，并且具备高度的灵活性和可组合性，同时实现具有良好扩展性的系统培训和执行，并在多智能体环境中进行分布式系统训练取得了良好的实验结果。

Jul, 2021

加速强化学习的人类启发式框架

本文提出了一种基于人类启发的框架以提高采样效率，其中通过逐步提供简单但相似的任务来适应复杂的强化学习任务，并且使用任何转移学习方法来减少样本复杂性而不增加计算复杂性，实验表明该框架能够在优化问题方面表现出良好的性能。

Feb, 2023

协作多智能体强化学习的高效分布式框架

本研究提出了一种基于 actor-work-learner 架构的分布式 MARL 框架，在 MaCA 军事模拟环境和 SMAC 3D 实时战略游戏环境中验证了其在多智能体强化学习性能提升方面的有效性。

May, 2022

多智能体强化学习用于微处理器设计空间探索

本文提出了使用 Multi-Agent RL 来应对硬件体系结构搜索中领域特定定制的挑战，此方法相对于单一智能体，其可扩展性更高且运行更高效。该方法已在设计领域特定 DRAM 内存控制器上得到验证，并表现出在低功耗和延迟等不同目标方面显著优于单一代理强化学习算法，如 Proximal Policy Optimization 和 Soft Actor-Critic。

Nov, 2022

强化学习学习

本文提出了一种名为深度元强化学习的方法，该方法使用递归网络，在一个强化学习算法上进行训练，但其递归动态实现第二个、完全分离的强化学习过程，通过一系列七个验验证明了这种方法的潜在优势并提出了其可能引发的神经科学方面的重要影响。

Nov, 2016

自动强化学习概述

论文探讨自动化强化学习的关键元素和挑战，并讨论自动化强化学习的最新工作、应用和研究方向。

Jan, 2022

多智能体深度强化学习的调查与批判

本文对当前多智能体深度强化学习文献进行清晰的概述，回顾前沿组件的发展并提出新手引导和研究前景，同时提出了多个实际挑战。

Oct, 2018

多接入边缘计算中的服务器放置和工作负载分配强化学习框架

本研究提出了一种使用强化学习解决最小化网络延迟和边缘服务器数量的问题的新 RL 框架，该问题涉及云计算、多接入边缘计算、组合优化问题和马尔可夫决策过程。

Feb, 2022

开放式任务空间中的人类时间尺度适应

本文介绍了一种训练 RL 代理器的方法，通过使用 meta-reinforcement 学习、基于注意力的内存结构和有效的自动课程表，该代理器可以快速适应开放式的 3D 问题，并具有自适应性。

Jan, 2023

分布式深度强化学习：调查与多人多代理学习工具箱

本文综述分布式深度强化学习的研究进展，对比不同方法、研究关键因素，回顾工具箱的发展，并且基于综述开发出多人、多智能体分布式深度强化学习工具箱，并在复杂游戏环境中进行验证。最后指出未来挑战和发展方向。

Dec, 2022