Aug, 2021

连续动作空间下的多智能体系统安全强化学习

TL;DR本文介绍了在深度强化学习模型中添加安全层以确保多智能体控制问题的安全性的方法,该方法采用线性化单步转换动态的思想,并使用软约束解决了实施步骤中的不可行性问题,在保证软约束的约束满足性的基础上实现了学习过程中的安全控制。