May, 2023

基于优先级的多智能体导航的受限环境优化

TL;DR本文考虑将环境视为一个系统级优化问题的决策变量,通过提出未排序和排序环境优化问题,分别考虑了代理人优先级与偏见。该文利用强化学习和原始对偶机制开发出了无模型解决方案,以处理约束条件,进一步阐释了环境与绩效之间的关系。数值结果证明了该方法的有效性和适应性。