May, 2023

动态物料处理的约束强化学习

TL;DR本研究旨在针对动态物料搬运需求,提出了一种自适应受限强化学习算法,名为 RCPOM,并通过一个动态物料处理的模拟器 DMH-GYM,对其进行了实验评估,结果表明相较于其他 8 种受限和非受限强化学习算法以及广泛使用的作业规则,我们提出的方法表现出了优秀的性能。