Apr, 2024

库存策略的 VC 理论

TL;DR计算能力和人工智能的进步增加了对强化学习在库存管理中的兴趣,本论文对这些方法提供了理论基础,并探讨了将政策结构限制为几十年来库存理论所熟知的结构的好处。我们利用 Vapnik-Chervonenkis 理论证明了对学习几种众所周知的库存策略(包括基准库存量和 (s, S) 策略)的泛化保证,应用了 Pseudo-dimension 和 Fat-shattering 维度的概念来确定库存策略的泛化能力。我们的研究结果从管理角度提供了以下见解:首先,在库存管理中存在 “学得越少越好” 的原则,根据可用的数据量,限制自己到一个更简单但次优的库存策略类别可能是有益的,以最小化过拟合误差。其次,策略类别中的参数数量可能并不是衡量过拟合误差的正确指标:事实上,由 T 个时变基准库存水平定义的策略类别的泛化误差与两个参数的 (s, S) 策略类别相当。最后,我们的研究建议在黑盒学习机器中将基准库存和库存位置的概念纳入,而不是让这些机器直接学习订购量行动。