MARLIM：多智能体强化学习于库存管理

Aug, 2023

MARLIM：多智能体强化学习于库存管理

MARLIM: Multi-Agent Reinforcement Learning for Inventory Management

Rémi Leluc, Elie Kadoche, Antoine Bertoncello, Sébastien Gourvénec

TL;DR通过优化补给决策，维持产品供需平衡是供应链行业面临的最重要挑战之一。本文使用一种名为 MARLIM 的新型强化学习框架，解决了具有随机需求和交货时间的单级多产品供应链的库存管理问题。数值实验结果表明，相比传统基准模型，强化学习方法具有显著优势。

Abstract

Maintaining a balance between the supply and demand of products by optimizing replenishment decisions is one of the most important challenges in the supply chain industry. This paper presents a novel reinforcement learning framework called →

supply chain inventory management reinforcement learning marlim stochastic demands

发现论文，激发创造

一项多功能的多智能体强化学习库存管理基准测试

本文介绍了一个名为 MABIM 的多代理数据集。作者使用该数据集对一些方法在多商品多层次库存管理问题的性能进行了评估，并探讨了多益智智能算法在实际行业中的应用。

Jun, 2023

库存管理的协作多智能体强化学习

本文提出了一种基于强化学习的库存管理系统，主要解决现实供应链环境下的计算需求和奖励框架等问题，并通过 GPU 并行化环境和状态动态规划等创新来优化大型零售商供应链需要。该系统实现了区别于基础库存策略的控制策略，并给出了未来研究方向的讨论。

Apr, 2023

多智能体强化学习在分散式库存控制系统中的分析

提出了一种使用多智能体强化学习的分散化数据驱动库存管理问题的解决方案，其中每个实体由一个智能体控制，通过对不同供应链网络和不确定性水平的模拟来研究近端策略优化算法的三个多智能体变体。中心化训练分散化执行的框架被部署，该框架依赖于离线集中化，以便在基于模拟的策略识别期间进行，但在策略在线部署到实际系统时实现分散化。结果表明，使用带有集中式评论者的多智能体近端策略优化方法可以实现接近集中式数据驱动解决方案的性能，并在大多数情况下优于分布式基于模型的解决方案，同时遵守系统的信息约束。

Jul, 2023

多智能体强化学习介绍及其在自主移动中的应用综述

该论文介绍了多智能体强化学习在自主移动中的应用，包括行为规划、车辆之间通信、性能提升等方面，并探讨了该领域的一些最新方法和想法。

Mar, 2022

基于模型的多智能体强化学习：最新进展和前景展望

本文回顾了现有的关于基于模型的多智能体强化学习的研究，包括理论分析、算法和应用，并分析了基于模型的多智能体强化学习的优势和潜力。此外，我们提供了算法的详细分类，并根据多智能体情景中固有的挑战指出每个算法的优点和缺点。最后，我们总结了这一领域未来发展的有前途的方向。

Mar, 2022

多智能体强化学习：综述

该论文调查了多智能体系统中学习最优控制的复杂性，旨在深入理解多智能体应用的机遇和挑战，为研究人员和从业者提供有价值的观点，以促进该领域的发展。

Dec, 2023

M$^3$RL: 意识感知的多智能体管理强化学习

本文提出 Mind-aware Multi-agent Management Reinforcement Learning (M^3RL) 算法，通过对多个自我意识且不可控制的机器人进行建模，实现超级机器人的管理和操纵，以实现最优的多机器人协同任务分配和奖励系统。

Sep, 2018

用于基于意图的蜂窝网络服务保障的多智能体强化学习

该论文介绍了一种基于多智能体强化学习技术的意图管理方法，通过优化重要 KPI 并协调各个闭环实现多个意图同时满足，实验结果表明该方法在实现意图和优化 KPI 方面表现良好。

Aug, 2022

网络代理的去中心化多智能体强化学习：最新进展

本文回顾了多智能体强化学习的一个分支领域 —— 网络化智能体下的去中心化多智能体强化学习。该领域的研究主要集中在多个代理在公共环境中执行顺序决策，而无需任何中央控制器的协调。代理可以通过通信网络与其邻居交换信息。此设置在机器人，无人驾驶车辆，移动传感器网络和智能电网的控制和操作中具有广泛应用。

Dec, 2019

机器人团队的分布式强化学习：回顾

本文总结了分布式无模型多智能体强化学习在多机器人协作中面临的挑战以及现有的解决方案类别，并介绍了基准测试和机器人应用，同时讨论了当前的研究方向。

Apr, 2022