Oct, 2022

安全覆盖控制的近似最优多智能体学习

TL;DR本论文提出了一种条件线性子模覆盖函数,用于多智能体覆盖控制问题中的密度学习和保证智能体的安全性,并开发了 MacOpt 和 SafeMac 算法来解决部分可观察性导致的勘探 - 开发困境,以及多智能体带安全探索的覆盖问题,实证研究表明 SafeMac 在安全约束下的任务性能优于竞争方法。