BriefGPT.xyz
Ask
alpha
关键词
curriculum generation
搜索结果 - 2
ICLR
MAESTRO: 多智能体强化学习的开放环境设计
本文提出了 Multi-Agent Environment Design Strategist for Open-Ended Learning (MAESTRO) 算法,该算法在多智能体环境中使用 Unsupervised Environm
→
PDF
a year ago
四人共舞:多智能体自我对弈用于自动生成课程
本研究提出一种自动化生成目标课程的框架 ——Curriculum Self Play(CuSP),通过多人游戏的方式平衡合作和竞争的关系,解决了训练通用强化学习智能体所面临的困难,并成功地生成了适用于各种控制任务的目标课程。
PDF
2 years ago
Prev
Next