本文提出了一个基于深度学习的两阶段学习框架 2SLFJSP 来解决制造和服务领域中非常重要的组合优化问题 —— 柔性作业车间调度问题(FJSP),该框架能够在毫秒级时间内生成高质量的解决方案,优于文献中最新的强化学习方法和其他常用的启发式方法。
Jan, 2023
本论文提出了一种名为 “残余调度” 的新方法,用于解决作业车间调度问题和灵活作业车间调度问题。实验证明,该方法在大多数著名的开放式作业车间调度问题和灵活作业车间调度问题基准测试中达到了最先进的水平。此外,研究还观察到,尽管该模型是针对较小规模的调度问题进行训练的,但在大规模调度问题上仍然表现良好。有趣的是,在实验中,该方法甚至在 20 台机器上有 150 个以上作业的 50 个作业车间调度实例中,有 49 个实例达到了零间隔。
Sep, 2023
使用深度强化学习技术搜索鲁棒解决方案的新方法,重点解决具有不确定持续时间的作业车间调度问题,并结合图神经网络和深度强化学习的 Wheatley 方法已公开提供以供进一步研究和应用。
Mar, 2024
本文提出了一种基于图神经网络的深度强化学习方法,用于解决作业车间调度问题中的改进启发式问题,并设计了一种新颖的传递信息机制来加快解决方案评估,实验结果表明,该方法比现有的基于深度强化学习的方法在 JSSP 领域中具有更好的性能.
Nov, 2022
我们提出了一种基于注意力机制的强化学习方法来解决作业车间调度问题,通过将策略梯度强化学习与改进的 Transformer 架构相结合,我们的方法在解决大规模问题上表现优于最近的研究和广泛采用的启发式规则。
Jan, 2024
本研究提出一种基于图神经网络和强化学习的框架来解决工厂作业车间调度问题,该框架将调度问题表示成了状态图,并使用 GNN 进行表示学习和策略学习,最终使用 PPO 算法对模型进行优化。实验结果表明,该模型优于传统的调度规则和基于强化学习的调度器,并且可以学习到一种具有泛化能力的调度策略。
Jun, 2021
本文提出了一种基于监督学习的变量排序策略,针对工厂车间问题进行求解,通过分类与回归模型预测问题实例的最优解,从而优化约束规划求解器的变量搜索顺序,并表明该方法表现优异,且与传统的基于领域的方法结合的混合策略效果更佳。
本文提出了一种基于约束编程(CP)和强化学习(RL)的端到端解决调度问题的方法,通过神经网络架构和训练算法,仅需要一些调度问题的约束编码和一组小实例,我们的方法在七个 JSSP 数据集上进行了评估,并展示了其在相同时间限制内找到比静态 PDRs 和 CP 求解器更高质量的解决方案的能力。
Jun, 2023
本文介绍了一种使用 DRL 求解 JSSP 问题的新方法,该方法使用了 PPO 算法并在环境中加入了 OSM 以实现更好的泛化学习,并在可用的基准实例集上进行了深入的性能分析和比较。
Feb, 2023
通过自动学习调度规则,本文提出了一种原创的端到端深度强化学习方法来解决作业调度的 NP - 难度问题,该技术受到自然语言编码器 - 解码器模型的启发,可在最小干预下用于处理其他不同的优化作业调度任务。研究结果表明,我们在利用优先调度规则方面超过了许多传统方法,并且在最先进的深度强化学习方法中取得了有竞争力的结果。
Aug, 2023