BriefGPT.xyz
Ask
alpha
关键词
strategic exploration
搜索结果 - 2
简单形神经元群体学习:在对称零和博弈中的任意混合贝叶斯最优性
本文提出了 Simplex-NeuPL 算法,通过基础策略的单个条件网络来学习代表策略上的多样性,同时学习最佳响应。实验结果表明,该算法能够有效地处理不确定性,并在测试时提供更好的表现。此外,学习任意混合策略的最佳响应是一种有效的战略探索辅
→
PDF
2 years ago
在赌博环境中通过行动进行社交学习
本文研究了一种带私人回报和公共行动的策略探索游戏,特别关注级联均衡,在这种均衡中,代理人会随着时间的推移从风险动作转换为无风险动作,仅当他们变得足够悲观。我们证明了在某些条件下这些均衡存在,并确定了它们的显著性质,同时研究了让代理人书写可执
→
PDF
2 years ago
Prev
Next