ICMLJun, 2022

分布式强化学习中的风险视角探析

TL;DR通过风险规划方法提高 DMIX 算法的性能,在多代理环境下进行了全面的实验,此方法可用于探索 Distributional Reinforcement Learning 中风险水平和乐观行为。