动态物料处理的约束强化学习

May, 2023

Constrained Reinforcement Learning for Dynamic Material Handling

Chengpeng Hu, Ziming Wang, Jialin Liu, Junyi Wen, Bifei Mao...

TL;DR本研究旨在针对动态物料搬运需求，提出了一种自适应受限强化学习算法，名为 RCPOM，并通过一个动态物料处理的模拟器 DMH-GYM，对其进行了实验评估，结果表明相较于其他 8 种受限和非受限强化学习算法以及广泛使用的作业规则，我们提出的方法表现出了优秀的性能。

Abstract

As one of the core parts of flexible manufacturing systems, material handling involves storage and transportation of materials between workstations with automated vehicles. The improvement in material handling ca

material handling automated guided vehicles constrained markov decision process reinforcement learning dynamic events

发现论文，激发创造

运用强化学习和迁移学习的制造调度

本文针对制造业生产中派工问题，运用强化学习提出了一种新的设计方法，将车间状态表示为 2D 矩阵，设计了适用于派工目的的延迟和超时奖励函数，并采用调度策略转移方法增强模型泛化能力和节省模型训练和数据收集时间。实验结果显示该方法在总折扣奖励和平均延迟、超时方面表现最佳。

Oct, 2019

基于事件的深度强化学习应用于动态车辆调度问题

本文提出了一种基于半马尔可夫决策过程和离散事件模拟的动态车辆调度问题解决方法，并在纽约市的真实场景下进行了数值实验，结果显示相对于其他启发式策略，该方法的平均等待时间减少了 50%。

Jul, 2023

利用强化学习实现碳减排潜力的三维装载有容量的车辆路径问题

使用强化学习模型解决三维装备车辆路径问题，使得物流优化向大规模应用迈出有希望的第一步。

Jul, 2023

在动态共享的 3D 空间中学习操控任务

提出了一种深度强化学习策略，旨在通过引入协作自主系统（例如操纵器）在工作场所和人操作员之间高效地学习多类别物品从共享工作空间到多目标目的地的放置任务。

Apr, 2024

应用强化学习进行机器人包装优化

本文提出了一个利用强化学习框架来优化传送带速度以最小化对系统其他部分的干扰，并使生产力、控制平滑和减少计算时间等方面有了显著提高的智能制造自动化解决方案。

Mar, 2023

资源受限的深度强化学习

为了优化城市资源分配，本文研究了基于 Deep RL 方法对于资源分配的约束条件以及对模拟器的表现

Dec, 2018

自行车共享系统中动态再平衡的强化学习方法

骑行共享系统是提供生态友好的城市出行方式，有助于减轻交通拥堵和改善健康生活方式。本研究提出一种基于时空强化学习算法的动态均衡问题解决方案，在多种数据集上的实验证明其在减少需求损失方面优于传统模型，为城市出行提供更智能、强大的解决方案。

Feb, 2024

基于深度 Q 学习的模块化生产环境下的车辆管理

本文研究了在离散事件模拟环境下，使用基于 Deep-Q 的深度强化学习代理来解决模块化生产设施中的作业车间调度问题。研究发现，相比于传统启发式和成本表等方法，基于 DRL 的代理相当，并且具有更高的噪声稳健性，对于这种类型的调度问题值得尝试。

May, 2022

基于视觉观察的机器人卸货的强化学习方法

我们提出了一个基于深度强化学习的分层控制器结构，通过使用 RGB-D 图像作为主要输入源，学习自主卸货任务，从而解决了获取标记数据困难的问题。实验证明，这种结构在提高学习性能方面起到了重要作用，并为未来的研究提供了一个可复现性和基准。

Sep, 2023

强化学习用于带有动作约束的任务规定

本文运用离散事件系统监控控制理论的概念，提出一种方法用于在有限状态的马尔可夫决策过程中，学习最优控制策略，并利用奖励机器的发展来处理状态限制。通过给定一个例子来阐明其应用性并在此设置中展示了仿真结果。

Jan, 2022