May, 2023

增强样例的混合系统中的高效强化学习及其在排队网络中的应用

TL;DR本文提出了一种基于样本的强化学习方法,旨在解决混合系统中数据样本不足的问题,通过生成增强数据样本,显著提高了学习效率。通过实验结果,证明了该方法在深度Q学习和深度策略梯度方面的有效性。