Sep, 2024

将强化学习作为现实生产调度的改进启发式方法

TL;DR本研究解决了应用强化学习(RL)于现实多目标生产调度问题的不足。通过将RL代理训练为改进启发式,初始从次优解出发,逐步应用小变更以提升解的质量。实验表明,该方法在与其他启发式比较时表现出更优的性能,潜在地提升生产调度的效率。