BriefGPT.xyz
Ask
alpha
关键词
offline marl
搜索结果 - 2
数字孪生的保守和风险意识离线多智能体强化学习
提出了一种适用于基于数字孪生的无线网络的离线多智能体保守分位回归 (MA-CQR) 方案,通过集成分布式强化学习和保守 Q 学习来解决环境的内在的随机性不确定性和数据有限性导致的认识不确定性。在无人机网络中应用该方案,展示了其对轨迹规划问题
→
PDF
5 months ago
离网 MARL: 一个数据集生成框架,具备合作离线多智能体强化学习基线
该研究为填补离线多智能体强化学习(MARL)领域中缺乏标准基准和评估方法的空白,提出了一个名为 OG-MARL 的离线 MARL 数据集和算法框架,包括一套标准评估方案。OG-MARL 的数据集本质上是从在线 MARL 基准中生成的,具有复
→
PDF
a year ago
Prev
Next