Jul, 2023

学习分散的部分可观测均场控制以实现人工集体行为

TL;DR该研究论文介绍了一种解决集体行为任务的多智能体增强学习算法,该算法使用平均场控制(MFC),并采用一种去中心化的、部分可观测的MFC模型。使用新的去中心化部分可观测MFC(Dec-POMFC)模型,该算法在代表性的集体行为任务上进行了数值评估,并提供了算法可行性和最优性保证。