通过控制理论中能量守恒的概念,将在线优化与游戏学习结合起来,证明了所有连续时间的 Follow-the-Regularized-Leader 动态都是无损耗的,这启发我们构建了一族具有简单梯度结构的无损耗学习动态,并将其拓展到了图形常和游戏等多种游戏动力学中。
Jun, 2021
本文提供了首个可适用于广义博弈顺序形式的复制动态系统,相较于现有的复制动态系统可以使时间和空间指数级降低,并证明了在离散时间和连续时间情况下的结果,同时拓展了标准工具以研究策略配置的稳定性。
Apr, 2013
本研究提出了一种在连续时间域中设计加速凸优化算法的建构性方法,该方法利用控制理论中的经典概念 —— 无源性和时间依赖变量的改变,通过将内部动态系统的输出映射到优化变量,得到与优化动态相关的李亚普诺夫函数,提供了一个具有灵活性的通用框架,可以生成带有不同收敛速度界限的凸优化算法。
Jun, 2023
本论文提出了 Taak-duality,一种将生态和基因型 / 表型类型都考虑在内的术语,并利用这种等价关系研究了高度一般化类型的生态进化轨迹,分析了有向进化的效率潜在限制。
May, 2023
本文研究了一类竞争场景,其中代理和它们玩的游戏都在时间上演化。该系统中的信息论保存定律、泊松回归和 Nash 均衡特征表明,尽管代理和游戏共同演化,但其结果仍然遵循一定的规律。同时,针对这种共同演化的网络游戏提出了预测代理行为的多项式时间算法。
Dec, 2020
本文提供了第一个严格的基础,证明了近似信息传递与状态演化在大系统极限下可以被用于矩阵感知算法,并将该分析推广到密集图上。证明技术与传统方法不同,在于它处理了根据因子图中的大量短环。
Jan, 2010
本文采用统计力学的普遍费米分布函数,对一种进化过程即成对比较进行了分析。我们首次得出了一个简单的封闭公式,它能够决定任何真正意义上的两人博弈中有限人群中合作的可行性。我们调查了有限群体中合作者的进化动态,并研究了选择强度和无限人口中固定点的残留物之间的相互作用,说明了这种相互作用如何在不同的选择强度下强烈影响有限人口中给定特征的趋向于固定的方式,从而导致直觉上不符合的结果。
Sep, 2006
使用信息几何概念和广义信息熵和离差构造了一种复制者动力学的家族 —— 护送复制者方程,提供了李雅普诺夫函数和进化博弈理论中的基本概念和构造的护送推广,例如护送的 Fisher 基本定理和 Shahshahani 几何的推广。
Nov, 2009
通过进化博弈理论的概念,我们解释了驱动耗散波色子系统中多重冷凝的形成,结果表明相对熵产生的消失决定了它们的选择。
Apr, 2015
研究表明,系统动力学响应随机信号的过程可以被解释为其计算环境变量的隐含模型;而模型的效率可以用熵来衡量,因此该研究揭示了信息使用的效率与热力学操作的关联。
Mar, 2012