Jun, 2022

作业车间调度中推广管理规则的学习

TL;DR本文介绍了一种基于强化学习的方法来更好地推广启发式分配规则,着重研究了任务车间调度问题的一般性问题,并提出了新颖的对抗性课程学习策略,该策略动态调整了学习过程中的难度水平来重新访问表现最差的问题实例。实验结果表明,这种方法明显优于当前 JSP 模型的现有技术水平,平均优化程度从 Taillard 的案例降低了 19.35%到 10.46%,从 Demirkol 的案例降低了 38.43%到 18.85%。