Sep, 2023

分布式强化学习的估计与推断

TL;DR本研究从统计效率的角度研究了分布式强化学习,重点研究了分布式策略评估问题,通过使用确定等价方法构建了一个估计器以解决样本效率问题,并研究了估计器的渐近行为。