Nov, 2023

使用软防护的安全强化学习对分布式灵活装配线进行调度

TL;DR研究了基于 Actor-Critic 强化学习方法的自动化装配线调度问题,提出了一种更简洁的环境表示方法,并引入基于 Monte-Carlo 树搜索的软屏蔽组件来改善调度过程中的不安全行为和风险监控。