BriefGPT.xyz
Ask
alpha
关键词
cooperative task decomposition
搜索结果 - 1
合作多智能体任务中的奖励机器学习
本文提出了一种新的多智能体强化学习方法,该方法将合作任务分解与学习奖励机器相结合,以编码子任务的结构。该方法有助于处理部分可观察环境中奖励的非马尔可夫性质,并提高了完成合作任务所需的学习策略的可解释性。每个子任务关联的奖励机器以分散的方式学
→
PDF
a year ago
Prev
Next