Jul, 2020

基于模型的强化学习的自适应离散化

TL;DR本篇论文介绍了一种基于模型的适应性离散技术,在大型(潜在连续的)状态-动作空间中设计一种高效的基于情节的强化学习算法,并通过实验证明,该算法在收敛速度和存储空间利用效率方面显著优于固定离散化。