Apr, 2024

具有控制理论安全保证的动态网络桥接的多智能体强化学习

TL;DR通过整合多智能体增强学习和控制理论方法,本文提出了一种混合方法来解决安全关键环境中的复杂合作任务,包括一个新颖的设定更新算法以动态调整智能体位置以保持安全条件而不影响任务目标。实验证明相比传统的多智能体增强学习策略,该方法在任务性能和安全违规方面取得了显著优势。研究结果表明,将安全控制与学习方法相结合不仅增强了安全合规性,还实现了良好的任务目标性能。