Jun, 2023

促进协作多智能体强化学习的层次任务网络规划

TL;DR本篇论文提出了 SOMARL 框架,利用符号知识嵌入 HTN 和元控制器中的 MARL 环境中,针对 FindTreasure 和 MoveBox 两种基准实验表现出比现有技术和基于子目标的基线更好的绩效。