护航进化博弈论
本文提供了首个可适用于广义博弈顺序形式的复制动态系统,相较于现有的复制动态系统可以使时间和空间指数级降低,并证明了在离散时间和连续时间情况下的结果,同时拓展了标准工具以研究策略配置的稳定性。
Apr, 2013
本文研究了一类竞争场景,其中代理和它们玩的游戏都在时间上演化。该系统中的信息论保存定律、泊松回归和 Nash 均衡特征表明,尽管代理和游戏共同演化,但其结果仍然遵循一定的规律。同时,针对这种共同演化的网络游戏提出了预测代理行为的多项式时间算法。
Dec, 2020
本文讨论了进化博弈理论作为一种强大而统一的数学工具,用于研究集体行为的演化,总结了作者最近通过进化博弈理论方法所涉及的一些研究方向,包括:i)随机进化博弈中(稳定)均衡数量的统计性质分析,以及 ii)在技术发展竞赛中建模安全行为的演化及先进人工智能技术带来的风险。最后,对未来研究者提出了展望和一些建议。
Nov, 2023
本文探讨了强化学习代理群体的复制者方程,证明基于环境反应的互动,代理们以自私的方式建模自己的环境,从而自然地出现游戏动力学,针对石头剪刀布游戏的应用证明了群体学习动力学具有多种多样的竞争和合作行为,包括准周期性,稳定极限环,间歇性和确定性混沌 – 这些行为在由我们导出的广义重复子方程描述的异质多智能体系统中应该得到预期。
Apr, 2002
这篇论文研究了进化博弈论的数学模型,探讨了在非简单情景下(如有限人口、不消失的突变率、随机决策、沟通等)运用基于个体的方法进行仿真的必要性,并总结了数学模型和计算仿真方法的优缺点。
Apr, 2014
本文采用统计力学的普遍费米分布函数,对一种进化过程即成对比较进行了分析。我们首次得出了一个简单的封闭公式,它能够决定任何真正意义上的两人博弈中有限人群中合作的可行性。我们调查了有限群体中合作者的进化动态,并研究了选择强度和无限人口中固定点的残留物之间的相互作用,说明了这种相互作用如何在不同的选择强度下强烈影响有限人口中给定特征的趋向于固定的方式,从而导致直觉上不符合的结果。
Sep, 2006
本研究将复制子方程解释为连续推理方程,并描述了离散复制子方程与贝叶斯推理之间的形式相似性,进一步阐明了推理和复制子方程之间的联系,包括讨论信息分歧和指数族作为复制者动态解的解决方案,使用 Fisher 信息和信息几何。
Nov, 2009
我们提出了基于进化博弈理论考虑的两种多智能体强化学习算法的变体。 一个变体的有意简化使我们能够证明它与一类常微分方程系统的复制子 - 变异体动力学的关系,从而通过它的常微分方程对应项在各种环境中展示了该算法的收敛条件。相较于更复杂的算法,另一个更复杂的变体允许与 Q 学习算法进行比较。我们在一系列环境中通过实验将这两个变体与 WoLF-PHC 和频率调整的 Q 学习进行比较,展示了我们的变体在维度增加的情况下保持收敛性的实例与更复杂算法的对比。解析结果的可用性相对于纯经验案例研究提供了一定的可转移性,展示了在处理收敛性和可靠的推广问题时,动力系统视角对多智能体强化学习的普适性。
May, 2024
该研究讨论了通过一系列合理的 Escort 平均值以及相关标准化量来表征概率密度的问题,特别是对于那些所有非零标准矩都具有发散值(例如幂律下降的概率密度),标准方法不适用的情况。同时,研究还涉及到与 Fourier 变换的非线性常数 q 有关的一些数学细节。
Feb, 2008
本论文提出了 Taak-duality,一种将生态和基因型 / 表型类型都考虑在内的术语,并利用这种等价关系研究了高度一般化类型的生态进化轨迹,分析了有向进化的效率潜在限制。
May, 2023