Jun, 2023

结构化状态抽象协作多智能体导航学习

TL;DR本研究提出了一个神经网络架构,旨在共同学习多个代理参与导航任务中的自适应状态空间抽象和通信协议,从而有效减少探索的状态空间的大小,并达到更好的政策性能。