BriefGPT.xyz
Ask
alpha
关键词
recursive reasoning
搜索结果 - 4
基于模型的对手建模
本文提出基于模型的对手建模(MBOM)方法,通过模拟环境模型中的递归推理过程和混合想象对手策略来适应各种类型的对手,在固定策略、初学者和推理者等多重对手场景中,MBOM 的适应性比现有方法更优。
PDF
3 years ago
ICML
R2-B2:基于递归推理的贝叶斯优化,用于非后悔学习博弈论
本文提出了一种递归推理形式化方法,即基于递归推理的贝叶斯优化,用于建模在重复博弈中,自利的有限理性代理与具有未知、复杂且昂贵的收益函数之间的互动过程。通过在比其他代理更高的二级或更高水平上推理,我们的递归推理方法可以实现更快的渐近收敛,我们
→
PDF
4 years ago
一般化递归推理模型下多智体互动中的有界理性建模
本文提出了一种广义的递归推理(GR2)框架,旨在建模具有不同分层次理性的代理,其架构能够使代理表现出不同层次的 “思考” 能力,使得上层代理可以更好地应对各种不那么复杂的学习者。我们在理论和实验方面都有贡献,首先在理论方面,通过概率图模型设
→
PDF
5 years ago
ICLR
多智能体强化学习的概率递归推理
本论文提出了一种基于递归推理与变分 Bayes 方法的多智体强化学习框架,该框架可以用于建模智体对手的行为,提高智体的自我决策能力以及使其在博弈中达成 Nash 均衡。实验证明,关于智体对手信念的推理,是智体强化学习中一个重要的方向。
PDF
5 years ago
Prev
Next