Nov, 2022

使用深度强化学习启发式方法解决协作Dec-POMDP问题

TL;DRSA2MA算法通过在第一阶段解决单智能体问题并获得策略,在第二阶段使用单智能体策略解决多智能体问题,能够在复杂智能体合作域中具有明显优势。