Jun, 2023

工业环境中部署强化学习的架构

TL;DR本论文介绍了一个基于 OPC UA 的运营技术意识强化学习体系结构,扩展了标准的 RL 设置,将其与数字孪生的设置相结合,与此同时,定义了一个 OPC UA 信息模型,允许进行通用的即插即用式交换 RL agent。通过解决玩具示例,本文演示和评估了体系结构,证明了该结构可用于使用真实控制系统确定最优策略。