Oct, 2022

多智能体灵活排程问题的强化学习方法

TL;DR本研究使用强化学习方法,提出了适用于自动生产中的调度问题的解决方案:使用 OpenAI gym 环境和启发式引导 Q-Learning 算法,成功地解决了多智能体柔性车间问题,并在该领域取得了最优解。