- 库存策略的 VC 理论
计算能力和人工智能的进步增加了对强化学习在库存管理中的兴趣,本论文对这些方法提供了理论基础,并探讨了将政策结构限制为几十年来库存理论所熟知的结构的好处。我们利用 Vapnik-Chervonenkis 理论证明了对学习几种众所周知的库存策略 - 革新零售分析:利用人工智能推进库存和客户洞察力
该研究旨在引入先进的智能零售分析系统(SRAS)来应对零售业面临的挑战,包括低效的排队管理、需求预测不准确和无效的营销策略,并通过利用基于机器学习的创新方法来提高零售效率和增强客户参与度。
- 使用通用价值函数学习领域支持的库存管理策略
一个使用强化学习和通用值函数的库存管理方法,通过域支持的库存补货策略实现了平衡可用性和浪费等目标,并提供了对决策的领域支持洞察。
- 库存管理中的缺货预测:分类技术和成本考虑
通过使用多个分类技术进行性能评估,结合利润函数和错分成本,本研究介绍了一种先进的分析方法来预测库存管理中的缺货情况,结果证明了预测模型在提高库存系统服务水平方面的有效性。
- 应对库存管理中需求的不确定性和变异性的多个独立差分进化优化
本实证研究旨在确定元启发式差分进化优化策略在随机需求背景下的库存管理领域的有效性,并通过深入调查揭示最有效的策略以最小化不确定需求模式下的库存成本。结果显示,差分进化算法在优化库存管理方面优于其他算法,同时探讨了拉丁超立方抽样等参数调优方法 - 一个高效智能的半自动化仓库盘点系统
在不断发展的供应链管理背景下,高效的库存管理对企业的重要性显著增加。这项研究引入了一种智能库存管理系统,以解决与不准确数据、延迟监测和过度依赖主观经验的预测相关的挑战。通过条形码和分布式应用技术的智能感知,结合全面的大数据分析,使数据驱动的 - 面向库存管理的业务指标感知预测
时序预测对于商业规划起重要作用,但常规预测度量的优化往往无视下游业务目标,导致与商业偏好不符的预测结果。本研究关注库存管理领域,以一种可微的端到端方式计算和优化常见的下游业务度量的代理指标,通过大量的成本权衡情景实证表明端到端优化通常优于对 - MARLIM:多智能体强化学习于库存管理
通过优化补给决策,维持产品供需平衡是供应链行业面临的最重要挑战之一。本文使用一种名为 MARLIM 的新型强化学习框架,解决了具有随机需求和交货时间的单级多产品供应链的库存管理问题。数值实验结果表明,相比传统基准模型,强化学习方法具有显著优 - 多智能体强化学习在分散式库存控制系统中的分析
提出了一种使用多智能体强化学习的分散化数据驱动库存管理问题的解决方案,其中每个实体由一个智能体控制,通过对不同供应链网络和不确定性水平的模拟来研究近端策略优化算法的三个多智能体变体。中心化训练分散化执行的框架被部署,该框架依赖于离线集中化, - 透过回顾可微政策优化实现网络中的神经库存控制
通过优化策略的效果并提出一种神经网络结构解决了库存管理的难点,我们可以稳定应用深度加强学习算法来对具有隐藏结构的问题进行优化。
- 一项多功能的多智能体强化学习库存管理基准测试
本文介绍了一个名为 MABIM 的多代理数据集。作者使用该数据集对一些方法在多商品多层次库存管理问题的性能进行了评估,并探讨了多益智智能算法在实际行业中的应用。
- 库存管理的协作多智能体强化学习
本文提出了一种基于强化学习的库存管理系统,主要解决现实供应链环境下的计算需求和奖励框架等问题,并通过 GPU 并行化环境和状态动态规划等创新来优化大型零售商供应链需要。该系统实现了区别于基础库存策略的控制策略,并给出了未来研究方向的讨论。
- 敏捷预测模型开发的精简框架:实现高效库存管理
提出了一种开发预测模型的框架,包括数据集清理、算法选择、多重交叉验证等步骤,以及在智能预测竞赛和库存管理中的应用。
- 共享资源下的库存管理多智能体强化学习
通过提出 Context-aware Decentralized PPO (CD-PPO) 算法,本研究利用 Shared-Resource Stochastic Game (SRSG) 模型解决了库存管理中的再订货决策问题,并通过大量实验 - 基于缩放 Beta 策略的市场做市
介绍了一种基于缩放贝塔分布的市场制造商行为新表示法,以及该方法在市场制造文献中的三个方法:单一价格层次选择、阶梯策略和即时市场制造等方面的泛化应用,研究发现该方法对自有资金管理非常有用,并通过高保真虚拟账本模拟器实验验证了该方法的优越性 - 大型供应链网络的通用库存管理策略学习
研究了基于强化学习的仓库库存管理算法,该算法可以用于产品和零售商数量都庞大的供应链系统,并提供了一种训练阶段中模拟系统的近似方法来解决处理大型系统的计算问题,实验证明了该算法可以成功地处理大型供应链网络。
- 供应链库存管理的深度强化学习方法
本文提出使用强化学习和深度学习技术来解决供应链库存管理问题,提供了随机两阶段供应链环境的数学形式,并开发了一个公开的库,以便使用深度强化学习算法解决 SCIM 问题。实验结果表明,DRL 相对于标准的重新订购策略表现更好,因此可以被视为解决 - 利用计算机视觉进行香蕉亚科分类和质量预测
本文介绍了基于计算机视觉技术的香蕉分类模型,可用于实现准确的香蕉品种识别和质量检测,从而帮助提高库存管理自动化和减轻手工劳动强度。经过对 3064 张香蕉图片数据集的训练,模型在香蕉品种和质量检测方面的准确性分别达到 93.4% 和 100 - 多产品库存管理中处理不确定交货期的基于学习的框架
本文考虑供应链中存在的交货期不确定性和因此导致的库存管理性能下降问题,提出了一种基于强化学习的延迟解决方法,并在多种不确定性的情景下进行了实证评估,证明该方法可以实现接近最优的性能。
- 约束马尔可夫决策过程的原始对偶方法
本文提出了一种基于采样的原始 - 对偶算法来解决带约束的马尔科夫决策过程,通过应用正则化策略迭代来改善策略,应用次梯度上升来保持约束。在弱耦合结构的情况下,通过嵌入式分解方法,能够显著减少问题的维度。将算法应用于多产品库存管理和多类队列调度