BriefGPT.xyz
Ask
alpha
关键词
dec-pomdp
搜索结果 - 4
Dec-POMDP 中的平衡 Monte-Carlo 搜索
本文介绍了一种基于模拟的 POMDP 求解器来构建 Dec-POMDP 的有限状态控制器节点以及一种相关的方法来启发式地导出初始 FSC,称为 MC-JESP,实验证明其竞争力甚至优于使用显式模型的许多离线方法
PDF
a year ago
AAAI
进化生成辅助对抗攻击者实现鲁棒的多智能体协调
该研究提出了一种名为 ROMANCE 的方法,通过演化生成辅助对抗攻击者,使训练的策略在训练期间遭遇多样性和强大的辅助对抗攻击,从而实现对策略扰动的高鲁棒性。该方法在多种场景中表现出与其他基准方法相当甚至更好的鲁棒性和泛化能力。
PDF
a year ago
使用深度强化学习启发式方法解决协作 Dec-POMDP 问题
SA2MA 算法通过在第一阶段解决单智能体问题并获得策略,在第二阶段使用单智能体策略解决多智能体问题,能够在复杂智能体合作域中具有明显优势。
PDF
2 years ago
电力分配网络主动电压控制的多智能体强化学习
本研究使用多智能体强化学习模型解决由去碳化趋势造成的电力网络中的电压拥塞问题,将主要问题转化为 Dec-POMDP 模型并建立开源环境,解决多智能体强化学习在状态可解释性等方面的挑战,为电力社区和多智能体强化学习社区寻求现实应用提供了实践基
→
PDF
3 years ago
Prev
Next