Jan, 2022

使用深度强化学习处理不确定的季节性需求和交货时间的多级供应链

TL;DR探讨了多级供应链中的生产计划和分配问题,利用深度增强学习技术 Proximal Policy Optimization(PPO2)来解决非线性不确定需求的问题,结果表明在有不确定性情况下,该方法更具优势。