BriefGPT.xyz
Ask
alpha
关键词
multi-agent tasks
搜索结果 - 3
Harfang3D Dog-Fight Sandbox: 战斗机定制控制任务的强化学习研究平台
介绍了一个半真实的飞行模拟环境 Harfang3D Dog-Fight Sandbox,为研究利用强化学习控制飞机的主要挑战提供了一个灵活的工具箱,可以使用深度强化学习技术进行训练,进而训练出能够表现出类似于人类行为的智能代理。
PDF
2 years ago
分解 Soft Actor-Critic 方法用于合作多智体强化学习
本文提出了一种新的分解式多智能体软演员 - 批评家(mSAC)方法,在 StarCraft II 微观管理合作式多智能体基准测试中获得高效和优异的性能。
PDF
3 years ago
ICLR
多智能体合作与竞争任务中的大规模通信时机学习
本文提出了 Individualized Controlled Continuous Communication Model (IC3Net),在多智能体协作、半协作与竞争环境下,通过门控机制控制持续传输,并使用个性化奖励来提高性能和可扩展
→
PDF
6 years ago
Prev
Next