Jun, 2023

由时序逻辑信号规范引导的多智能体强化学习

TL;DR本论文提出了一种新的基于STL模板的多智能体强化学习算法以指导奖励设计,实验证明相比没有STL指导的情况下,算法能够显著提高多智能体系统的性能和安全性。