Jun, 2021

学习调度作业车间问题:利用图神经网络和强化学习进行表示和策略学习

TL;DR本研究提出一种基于图神经网络和强化学习的框架来解决工厂作业车间调度问题,该框架将调度问题表示成了状态图,并使用 GNN 进行表示学习和策略学习,最终使用 PPO 算法对模型进行优化。实验结果表明,该模型优于传统的调度规则和基于强化学习的调度器,并且可以学习到一种具有泛化能力的调度策略。