利用深度强化学习生成多样的调度策略解决大规模柔性车间调度实例

Oct, 2023

利用深度强化学习生成多样的调度策略解决大规模柔性车间调度实例

Solving large flexible job shop scheduling instances by generating a diverse set of scheduling policies with deep reinforcement learning

PDF

Imanol Echeverria, Maialen Murua, Roberto Santana

TL;DR提出了一种使用图神经网络将灵活作业车间调度问题 (FJSSP) 建模为马尔可夫决策过程 (MDP) 的方法，通过生成多样化的调度策略并利用调度规则进行限制，实现对大型 FJSSP 实例的稳健解决，以胜过其他深度强化学习方法和调度规则，提供更好的结果。

Abstract

The flexible job shop scheduling problem (FJSSP) has been extensively studied in the literature, and multiple approaches have been proposed within the heuristic, exact, and metaheuristic methods. However, the industry's demand to be able to respond in real-time to disruptive events has

flexible job shop scheduling problem dispatching rules markov decision process reinforcement learning graph neural networks

发现论文，激发创造

在深度学习方法中利用约束编程动态解决柔性车间调度问题

我们提出了一种融合了约束编程和深度学习的方法来解决灵活作业车间调度问题，该方法通过使用约束编程生成的最优解来训练深度学习模型，以消除深度强化学习中广泛搜索的需求，并在解决过程中共同应用深度学习和约束编程来提高性能。

Mar, 2024

柔性车间调度问题的两阶段学习

本文提出了一个基于深度学习的两阶段学习框架 2SLFJSP 来解决制造和服务领域中非常重要的组合优化问题 —— 柔性作业车间调度问题（FJSP），该框架能够在毫秒级时间内生成高质量的解决方案，优于文献中最新的强化学习方法和其他常用的启发式方法。

Jan, 2023

深度强化学习在作业车间调度中的搜索应用

本文提出了一种基于图神经网络的深度强化学习方法，用于解决作业车间调度问题中的改进启发式问题，并设计了一种新颖的传递信息机制来加快解决方案评估，实验结果表明，该方法比现有的基于深度强化学习的方法在 JSSP 领域中具有更好的性能.

Nov, 2022

强化学习的模因算法用于社技生产调度

本文介绍了一种利用深度强化学习应用的模因算法，用于解决实践中的双重资源约束柔性作业车间调度问题，并提出一种用于多标准优化的并行计算混合框架。通过实践证实，该框架使用 DRL 可以产生更好的结果，并优于传统方法。

Dec, 2022

残余调度：解决工作车间调度问题的新强化学习方法

本论文提出了一种名为 “残余调度” 的新方法，用于解决作业车间调度问题和灵活作业车间调度问题。实验证明，该方法在大多数著名的开放式作业车间调度问题和灵活作业车间调度问题基准测试中达到了最先进的水平。此外，研究还观察到，尽管该模型是针对较小规模的调度问题进行训练的，但在大规模调度问题上仍然表现良好。有趣的是，在实验中，该方法甚至在 20 台机器上有 150 个以上作业的 50 个作业车间调度实例中，有 49 个实例达到了零间隔。

Sep, 2023

深度强化学习和关注机制的动态车间调度混合智能

本文提出了一种将动态车间调度问题 (DJSP) 建模为强化学习的马尔可夫决策流程 (MDP) 的混合框架，并结合了注意力机制作为图表示学习 (GRL) 的模块，以及双层权利分离深度 Q 网络评估最适当的调度规则，经实验证明该框架优于基准算法，并证实了这种混合框架的有效性。

Jan, 2022

一种强化学习方法用于通过排序交换提高泛化性能的调度问题

本文介绍了一种使用 DRL 求解 JSSP 问题的新方法，该方法使用了 PPO 算法并在环境中加入了 OSM 以实现更好的泛化学习，并在可用的基准实例集上进行了深入的性能分析和比较。

Feb, 2023

在不确定条件下学习解决作业车间调度

使用深度强化学习技术搜索鲁棒解决方案的新方法，重点解决具有不确定持续时间的作业车间调度问题，并结合图神经网络和深度强化学习的 Wheatley 方法已公开提供以供进一步研究和应用。

Mar, 2024

基于学习的灵活车间调度算法在可扩展智能制造中的应用

在智能制造系统中，基于自动导引车的生产灵活性的柔性作业车间调度是优化生产效率的关键，该研究通过引入名为 Heterogeneous Graph Scheduler (HGS) 的新型图结构的深度强化学习方法，可以提高规模泛化性能，超越了传统调度规则、元启发式算法和现有 DRL 方法在制造调度中的性能表现。

Feb, 2024

基于约束编程的作业车间调度问题的端到端强化学习方法

本文提出了一种基于约束编程（CP）和强化学习（RL）的端到端解决调度问题的方法，通过神经网络架构和训练算法，仅需要一些调度问题的约束编码和一组小实例，我们的方法在七个 JSSP 数据集上进行了评估，并展示了其在相同时间限制内找到比静态 PDRs 和 CP 求解器更高质量的解决方案的能力。

Jun, 2023