Jun, 2022

关于在重复博弈中无法学习适应性合作策略的问题

TL;DR本研究旨在了解在没有特定假设的情况下,我们是否能可靠地学会与其他具有自适应行为的智能体合作,并得出一组不可能性结果,表明即使智能体保证与某些固定策略合作,也没有学习算法可以可靠地学习如何与所有可能的自适应伙伴合作;随后讨论了捕捉自适应伙伴只会理性地适应我们行为的潜在替代假设。