本文讨论了进化博弈理论作为一种强大而统一的数学工具,用于研究集体行为的演化,总结了作者最近通过进化博弈理论方法所涉及的一些研究方向,包括:i)随机进化博弈中(稳定)均衡数量的统计性质分析,以及 ii)在技术发展竞赛中建模安全行为的演化及先进人工智能技术带来的风险。最后,对未来研究者提出了展望和一些建议。
Nov, 2023
本文通过进化博弈理论和基于代理的建模和仿真技术,对在多智能体系统中通过多个交互者的存在和互动的多种行为策略下涌现和演变的集体行为机制的主要研究方向和挑战进行了总结,包括将认知和情感机制引入智能体的实现、在复杂网络中促进亲社会行为的成本效益干预、AI 安全发展生态的监管和治理以及随机演化多人游戏的平衡分析。总之,本文描述了该小组视图或优先考虑的 MAS 研究中的重要开放问题。
May, 2022
本文研究了一类竞争场景,其中代理和它们玩的游戏都在时间上演化。该系统中的信息论保存定律、泊松回归和 Nash 均衡特征表明,尽管代理和游戏共同演化,但其结果仍然遵循一定的规律。同时,针对这种共同演化的网络游戏提出了预测代理行为的多项式时间算法。
Dec, 2020
进化博弈论和人工智能两个领域虽然乍看起来不同,但它们具有显著的联系和交叉点。本文旨在通过交叉思想促进多智能体学习系统的数学进展,特别是在 “集体合作智能” 领域,以连接进化动力学和多智能体强化学习。
Mar, 2024
本文探讨了一种基于进化博弈论思想的解决方法来解决一组同质且自主代理在未知且随机环境中的路径规划问题,研究了多智能体规划方法,并展示了我们的技术在大空间中最小化路径长度方面击败了现有的状态良好的强化学习算法近 30%,并且比深度强化学习方法快至少一个数量级,并且与其他方法相比,扩展性更好,最后,我们证明了我们学到的政策在演化上是稳定的。
Dec, 2022
提出一种新的方法来分析多智体系统中的对称和不对称多人博弈,并在 Wolfpack 和 StarCraft II 上进行了实证博弈理论分析,证明了该方法的有效性。
Jun, 2022
本文提供了首个可适用于广义博弈顺序形式的复制动态系统,相较于现有的复制动态系统可以使时间和空间指数级降低,并证明了在离散时间和连续时间情况下的结果,同时拓展了标准工具以研究策略配置的稳定性。
Apr, 2013
通过优化遗传算法,模拟物种在环境中的进化与自然选择,研究物种间相互作用,预测未来的变化,寻找生物进化的途径及其应用。
Sep, 2022
借助进化游戏设计和遗传算法,本研究扩展了现有的方法来生成《Risk》这个桌游的新变种版本,通过改变地图大小和生成更加平衡的游戏以减短比赛时间,为进一步研究演化游戏设计提供了有希望的方向。
Oct, 2023
扩展进化博弈论通过允许玩家策略及其回报随着遗传变异的选择而进化,提供了一般框架来理解策略和回报在迭代博弈中的共同进化过程,揭示出利益和成本之间的权衡使得合作的瓦解是如此极端以至于合作的平均回报可能下降,即使相互合作的潜在回报仍在增加。
Feb, 2014