学习调度作业车间问题：利用图神经网络和强化学习进行表示和策略学习

Jun, 2021

学习调度作业车间问题：利用图神经网络和强化学习进行表示和策略学习

Learning to schedule job-shop problems: Representation and policy learning using graph neural network and reinforcement learning

PDF

Junyoung Park, Jaehyeong Chun, Sang Hun Kim, Youngkook Kim, Jinkyoo Park

TL;DR本研究提出一种基于图神经网络和强化学习的框架来解决工厂作业车间调度问题，该框架将调度问题表示成了状态图，并使用 GNN 进行表示学习和策略学习，最终使用 PPO 算法对模型进行优化。实验结果表明，该模型优于传统的调度规则和基于强化学习的调度器，并且可以学习到一种具有泛化能力的调度策略。

Abstract

We propose a framework to learn to schedule a job-shop problem (JSSP) using a graph neural network (GNN) and reinforcement learning (RL).

job-shop problem graph neural network reinforcement learning scheduling sequential decision-making

发现论文，激发创造

深度强化学习在作业车间调度中的搜索应用

本文提出了一种基于图神经网络的深度强化学习方法，用于解决作业车间调度问题中的改进启发式问题，并设计了一种新颖的传递信息机制来加快解决方案评估，实验结果表明，该方法比现有的基于深度强化学习的方法在 JSSP 领域中具有更好的性能.

Nov, 2022

图神经网络用于工作车间调度问题的综述

此篇综述主要介绍了图神经网络在解决调度问题中的应用，探讨了不同类型的作业车间调度问题和流水车间调度问题，并重点研究了深度强化学习方法。通过介绍图表示和常用的图神经网络架构，作者回顾了各种问题类型的 GNN 方法，在图表示、图神经网络架构、GNN 任务和训练算法等技术要素方面进行了重点概述。最后，作者总结和分析了 GNN 在解决调度问题中的优势和局限性，并提供了潜在的未来研究机会。希望这个综述能够激发创新思路，为更强大的基于图神经网络的方法解决调度问题和其他调度问题提供启示。

Jun, 2024

在不确定条件下学习解决作业车间调度

使用深度强化学习技术搜索鲁棒解决方案的新方法，重点解决具有不确定持续时间的作业车间调度问题，并结合图神经网络和深度强化学习的 Wheatley 方法已公开提供以供进一步研究和应用。

Mar, 2024

利用强化学习进行车间作业调度的课程学习

本研究通过引入难度变化和课程学习策略来改进深度强化学习方法，基于图嵌入实现的 DLR 方法在解决工作车间调度问题方面取得了显著的效果。

May, 2023

利用深度强化学习生成多样的调度策略解决大规模柔性车间调度实例

提出了一种使用图神经网络将灵活作业车间调度问题 (FJSSP) 建模为马尔可夫决策过程 (MDP) 的方法，通过生成多样化的调度策略并利用调度规则进行限制，实现对大型 FJSSP 实例的稳健解决，以胜过其他深度强化学习方法和调度规则，提供更好的结果。

Oct, 2023

一种强化学习方法用于通过排序交换提高泛化性能的调度问题

本文介绍了一种使用 DRL 求解 JSSP 问题的新方法，该方法使用了 PPO 算法并在环境中加入了 OSM 以实现更好的泛化学习，并在可用的基准实例集上进行了深入的性能分析和比较。

Feb, 2023

基于约束编程的作业车间调度问题的端到端强化学习方法

本文提出了一种基于约束编程（CP）和强化学习（RL）的端到端解决调度问题的方法，通过神经网络架构和训练算法，仅需要一些调度问题的约束编码和一组小实例，我们的方法在七个 JSSP 数据集上进行了评估，并展示了其在相同时间限制内找到比静态 PDRs 和 CP 求解器更高质量的解决方案的能力。

Jun, 2023

通过深度强化学习学习调度，以进行车间调度

本文提出利用端到端的深度强化学习代理自动学习优先调度规则 (Priority dispatching rule) 来解决实际的作业车间调度问题 (Job-shop scheduling problem)，探索应用离散图表示和基于图神经网络的方案将状态嵌入到神经网络中，从而实现了良好的泛化性能（generalization）。实验表明，学习的策略还表现出较强的性能，超越最佳现有 PDR，而且在训练时未使用的更大规模实例上表现出良好的性能。

Oct, 2020

引入 PetriRL：一个集成 Petri 网和基于事件的强化学习的 JSSP 解决方案的创新框架

我们介绍了一种创新的框架来解决作业车间调度问题，通过使用 Petri 网建模作业车间，提高了可解释性，同时还实现了将原始数据直接整合到过程中，无需对作业车间实例进行预处理，Petri 网的控制功能使得自动化组件能够掌控流程，允许智能体专注于关键决策，尤其是资源分配。在公共测试基准上，我们的方法在事件驱动控制和行为屏蔽的整合下表现出竞争优势的性能。对各种优化解决方案（包括启发式算法、元启发式算法和基于学习的算法）进行的比较分析凸显了我们的方法在大规模实例中的竞争力以及在小至中等规模场景中优于所有竞争对手的优越性。我们的方法不仅具有跨各种实例规模泛化的鲁棒能力，而且利用 Petri 网的图形特性，在推理阶段动态添加作业操作，无需对智能体进行重新训练，从而提高了灵活性。

Jan, 2024

使用图神经网络和强化学习生成中断允许的阻塞工作车间问题的调度规则

采用图神经网络和强化学习方法生成调度规则来解决中断允许阻塞作业车间问题，结果表明这种方法可以有效地调度机器故障随机的生产线。

Feb, 2023