ICMLMay, 2019

协作进化强化学习

TL;DR本研究介绍了一种名为 CERL 的可扩展框架,其中包含一组策略,这些策略同时探索和利用解决方案空间的不同区域,并使用神经进化将这个过程绑定在一起,从而生成一个超越任何个体学习器的单个新兴学习器。实验表明,这个新兴学习器在连续控制基准测试中优于其复合学习器,并保持整体更高的采样效率。