BriefGPT.xyz
Ask
alpha
关键词
matrix game
搜索结果 - 2
关于在重复博弈中无法学习适应性合作策略的问题
本研究旨在了解在没有特定假设的情况下,我们是否能可靠地学会与其他具有自适应行为的智能体合作,并得出一组不可能性结果,表明即使智能体保证与某些固定策略合作,也没有学习算法可以可靠地学习如何与所有可能的自适应伙伴合作;随后讨论了捕捉自适应伙伴只
→
PDF
2 years ago
透明对手之间的双人游戏学习
本文以两个强化学习代理经常在矩阵游戏中相互博弈作为情境,考虑透明性决策制定对于对手的预测及对手感知梯度步长能力,探究透明性决策制定与对手感知学习相结合能否在囚徒困境和鸡斗中取得可接受的收益等问题,发现透明性决策制定和对手感知学习的组合能对囚
→
PDF
4 years ago
Prev
Next