Jun, 2023
多样性投影集合的分布式强化学习
Diverse Projection Ensembles for Distributional Reinforcement Learning
Moritz A. Zanger, Wendelin Böhmer, Matthijs T. J. Spaan
TL;DR本研究探讨了如何通过集合及多样性实现可靠的不确定性估计和深度探索,即通过几个不同的分布投影和表现形式的集合所组成的 “分布整体学习”(distributional ensemble)来实现优秀的性能。