Aug, 2023

MARLIM:多智能体强化学习于库存管理

TL;DR通过优化补给决策,维持产品供需平衡是供应链行业面临的最重要挑战之一。本文使用一种名为 MARLIM 的新型强化学习框架,解决了具有随机需求和交货时间的单级多产品供应链的库存管理问题。数值实验结果表明,相比传统基准模型,强化学习方法具有显著优势。