BriefGPT.xyz
Ask
alpha
关键词
multi-agent training
搜索结果 - 3
IJCAI
Pommerman 多智能体训练:课程学习与基于人口自我对弈的方法
该研究介绍了一个使用课程学习和基于群体的自我对弈相结合的系统,用于训练多智能体系统玩 Pommerman,并解决了稀疏奖励和合适匹配机制的两个挑战性问题。实验结果表明,我们训练的智能体可以在不需要盟友间通信的情况下胜过顶尖的学习智能体。
PDF
6 days ago
AAAI
互动学习和辅助学习
本文通过引入多智能体训练框架,提出交互式学习作为一种替代奖励或演示驱动学习的方法,并通过一系列实验展示了信息共享、信息查询和问答等交互学习行为的出现,最终发现该方法可以使得自主智能体在不需要显式演示或奖励函数的情况下,与人类合作执行任务并获
→
PDF
5 years ago
通过基于记忆的通信提高小规模多智体深度强化学习中的协调
本文提出了一个基于深度确定性策略梯度的多智能体训练框架,利用存储设备并发端到端学习明确的通信协议,来提高小规模系统中智能体的协作和性能,同时研究了不同通信模式对性能的影响。
PDF
5 years ago
Prev
Next