Jan, 2022
深度强化学习和关注机制的动态车间调度混合智能
Hybrid intelligence for dynamic job-shop scheduling with deep reinforcement learning and attention mechanism
Yunhui Zeng, Zijun Liao, Yuanzhi Dai, Rong Wang, Xiu Li...
TL;DR本文提出了一种将动态车间调度问题 (DJSP) 建模为强化学习的马尔可夫决策流程 (MDP) 的混合框架,并结合了注意力机制作为图表示学习 (GRL) 的模块,以及双层权利分离深度 Q 网络评估最适当的调度规则,经实验证明该框架优于基准算法,并证实了这种混合框架的有效性。