May, 2022

基于深度 Q 学习的模块化生产环境下的车辆管理

TL;DR本文研究了在离散事件模拟环境下,使用基于 Deep-Q 的深度强化学习代理来解决模块化生产设施中的作业车间调度问题。研究发现,相比于传统启发式和成本表等方法,基于 DRL 的代理相当,并且具有更高的噪声稳健性,对于这种类型的调度问题值得尝试。