BriefGPT.xyz
Ask
alpha
关键词
opponents' behavior
搜索结果 - 1
模仿以获胜:多智能竞争游戏中的模仿学习策略
我们提出了一种新的多智能体模仿学习模型,用于预测对手的下一步动作,并将其与策略训练结合为一个训练过程的多智能体强化学习算法,在三个具有挑战性的游戏环境中进行了广泛实验,结果表明我们的方法在性能上优于现有的多智能体强化学习算法。
PDF
a year ago
Prev
Next