Jan, 2022

深度强化学习和关注机制的动态车间调度混合智能

TL;DR本文提出了一种将动态车间调度问题 (DJSP) 建模为强化学习的马尔可夫决策流程 (MDP) 的混合框架,并结合了注意力机制作为图表示学习 (GRL) 的模块,以及双层权利分离深度 Q 网络评估最适当的调度规则,经实验证明该框架优于基准算法,并证实了这种混合框架的有效性。