BriefGPT.xyz
Ask
alpha
关键词
multi-agent competitive games
搜索结果 - 2
模仿以获胜:多智能竞争游戏中的模仿学习策略
我们提出了一种新的多智能体模仿学习模型,用于预测对手的下一步动作,并将其与策略训练结合为一个训练过程的多智能体强化学习算法,在三个具有挑战性的游戏环境中进行了广泛实验,结果表明我们的方法在性能上优于现有的多智能体强化学习算法。
PDF
a year ago
网络马尔可夫潜力博弈中本地化 Actor-Critic 的收敛速率
本研究提出了一种基于网络结构的马尔可夫潜在博弈模型,以及一种局部演员 - 评论家算法,利用函数逼近方法克服了维度诅咒,并给出了与局部误差和函数逼近误差有关的有限样本保证,实验证明该算法能够有效地处理多智能体竞争博弈问题。
PDF
a year ago
Prev
Next