Oct, 2023

利用深度强化学习生成多样的调度策略解决大规模柔性车间调度实例

TL;DR提出了一种使用图神经网络将灵活作业车间调度问题 (FJSSP) 建模为马尔可夫决策过程 (MDP) 的方法,通过生成多样化的调度策略并利用调度规则进行限制,实现对大型 FJSSP 实例的稳健解决,以胜过其他深度强化学习方法和调度规则,提供更好的结果。