Apr, 2023

基于双层潜变量模型的高效样本多智能体强化学习

TL;DR本研究使用 BiLL (Bi-Level Latent Variable Model-based Learning) 算法来解决多智能体强化学习 (MARL) 算法中高样本复杂性的问题,通过从高维度的输入数据学习一个双层潜变量模型,在全局状态和每个智能体层面上,学习生成潜在的轨迹,在挑战性的 SMAC 和 Flatland 环境中,该算法在样本效率方面优于最先进的无模型和有模型基线.