BriefGPT.xyz
Ask
alpha
关键词
procedurally generated worlds
搜索结果 - 2
NeurIPS 2022 神经网络 MMO 挑战赛:基于专业化和交易的大规模多智能体竞赛
该论文总结了 NeurIPS-2022 神经多人在线游戏挑战赛的设计和结果,探索了该环境作为学习方法基准的潜力,并提出了一些对于具有稀疏奖励的复杂任务的实用强化学习训练方法。另外,论文还开源了基线模型,包括环境封装器、基准测试和可视化工具,
→
PDF
8 months ago
开放式学习导致通用能力的代理
本文介绍了一种基于多智能体、开放式学习的方法,其能够使得智能体在一种包含大量挑战、跨越多个任务、更广泛的行为通用化领域中表现出非凡的学习能力。通过在环境中建立一个任务的宇宙,我们的训练代理能够跨越更广泛的任务领域,这个领域自然多智能体,涉及
→
PDF
3 years ago
Prev
Next