Oct, 2020

通过深度强化学习学习调度,以进行车间调度

TL;DR本文提出利用端到端的深度强化学习代理自动学习优先调度规则 (Priority dispatching rule) 来解决实际的作业车间调度问题 (Job-shop scheduling problem),探索应用离散图表示和基于图神经网络的方案将状态嵌入到神经网络中,从而实现了良好的泛化性能(generalization)。实验表明,学习的策略还表现出较强的性能,超越最佳现有 PDR,而且在训练时未使用的更大规模实例上表现出良好的性能。