Jun, 2020

Acme:分布式强化学习研究框架

TL;DR介绍了一种名为 Acme 的深度强化学习框架,该框架旨在构建简单、模块化的组件,以便在不同规模的执行中使用。其主要目标是为算法开发提供一个框架,同时也提供了重要或最先进算法的简单参考实现以提升强化学习研究的可重复性和基准。本文描述了 Acme 中的主要设计决策和该框架如何被用于实现各种算法的详细信息,同时对重要或最先进算法进行了基线实验,并展示了如何将这些算法扩展到更大和更复杂的环境中。