Feb, 2023

一种强化学习方法用于通过排序交换提高泛化性能的调度问题

TL;DR本文介绍了一种使用 DRL 求解 JSSP 问题的新方法,该方法使用了 PPO 算法并在环境中加入了 OSM 以实现更好的泛化学习,并在可用的基准实例集上进行了深入的性能分析和比较。