BriefGPT.xyz
Ask
alpha
关键词
distributional actor-critic algorithm
搜索结果 - 1
使用虚拟对手模型进行决策
提出了一种基于分布式 Actor-Critic 算法的多智能体虚拟对手建模方法,通过构建虚拟模型来模拟未观察到对手的行为,使用本地可得信息实现虚拟对手模型的训练和优化。实验证明该方法能有效准确地模拟对手行为,相较于基线方法具有更快的收敛速度
→
PDF
2 years ago
Prev
Next