Oct, 2023

目标足够: 在IMFs中诱发未知多智体系统的无约束合作

TL;DR通过使用AI-based supervisor agent,我们提出了一种框架,可以并行地编排预训练的agent,该框架通过为MARL代理分配最佳目标并激励它们展示特定的期望行为来实现。在网络仿真器上的结果显示,与基于规则的方法相比,所提出的方法在更快和更好地实现期望的同时,甚至推广到环境变化。