Feb, 2018

分类分布式强化学习的分析

TL;DR本文为分布式 RL 算法提出了一个分析 CDRL 算法的框架,证明了投影分布 Bellman 计算器在 distributional RL 中的重要性,从根本上联系 CDRL 和 Cramér 距离,并为基于样本的分类分布式 RL 算法提供了收敛性证明。