单机快速基于种群的强化学习

Jun, 2022

Fast Population-Based Reinforcement Learning on a Single Machine

Arthur Flajolet, Claire Bizon Monroc, Karim Beguir, Thomas Pierrot

TL;DR通过编译和矢量化的技术，我们验证了集群训练可以在单台机器上进行，同时大于单个智能体训练，以及它可以被用于超参数调整。

Abstract

Training populations of agents has demonstrated great promise in reinforcement learning for stabilizing training, improving exploration and asymptotic performance, and generating a diverse set of solutions. However, pop