Jan, 2019

预期和分布式强化学习的比较分析

TL;DR通过对tabular、线性和非线性逼近设置的分析,研究了分布式RL相对于标准RL的改进原因。在控制设置中,以经验分析比较了分布式RL和标准RL的方法,找出了分布式RL方法的改进来源。