- 时变变分不等式的跟踪解决方案
用追踪方法研究时间变化的变分不等式在博弈论、优化和机器学习等领域的应用问题,将已有研究扩展到非单调函数的情况,并对离散动力系统的收敛行为和轨迹进行详细研究,并通过实验验证了理论结果。
- 大型语言模型在混合策略纳什均衡游戏中的应用
本研究旨在研究博弈论和生成人工智能的交叉领域,聚焦于大型语言模型在找到混合策略 Nash 均衡的游戏中的能力,发现了大型语言模型在运行代码和提供特定提示的情况下性能显著提高,但也揭示了在难以推断游戏的随机化策略时,大型语言模型的限制性。该论 - 学习战略性讨论:一项关于狼人杀的案例研究
通过研究 One Night Ultimate Werewolf (ONUW) 游戏中的讨论策略对玩家效用的影响,本研究发现讨论对于改变玩家信念和提升讨论策略的重要性,并提出了基于强化学习的讨论策略训练框架,通过实验证明了该框架的效果和泛化 - 游戏理论深度强化学习在地理分布式数据中心中最小化 AI 推断工作负载的碳排放和能源成本
通过结合博弈论和深度强化学习的方法,本研究在地理分布的数据中心中优化 AI 推理工作负载的分配,以降低碳排放和云服务成本,同时保持性能。实验证明,该策略在减少碳排放和云服务成本方面优于现有技术,并且不会损害计算性能。这对处理不同地理位置的 - 关于 LLMs 决策能力的探究:在多智能体环境中评估 LLMs 的游戏能力
通过 Game Theory 基于 GAMA-Bench 框架评估 LLMs 的决策能力,研究发现 GPT-3.5 在鲁棒性方面表现出色,但其概括能力相对有限,通过 Chain-of-Thought 等方法可以提高其性能;此外,评估发现 G - 人工智能时代的基于语言的博弈论
通过情感分析来研究决策和策略互动中的人类行为,以改变传统基于结果的效用函数观点,强调语言的重要性,为经济学、心理学和人工智能领域提供新颖的博弈论方法。
- 政策空间响应预测:一项调查
在游戏理论中,一个游戏指的是理性决策者或玩家之间相互作用的模型,他们通过选择来实现各自的目标。本文简要概述了一种快速发展的用于大型游戏的游戏推理框架 —— 策略空间响应预言机(PSRO)。我们首先阐述了引入 PSRO 的动机,并提供了历史背 - AI 对齐在社会技术系统中的激励兼容性:地位与前景
探索如何利用博弈论的激励兼容性原则来弥合技术和社会组成部分之间的差距,以在不同的背景下与人类社会保持人工智能共识。
- 大型语言模型作为双人游戏中的代理
通过在单一统一的机器学习范式中正式定义大型语言模型(LLM)的训练过程,包括预训练、监督微调和强化学习与人类反馈,我们可以获得推进 LLM 技术的重要见解。本文勾勒出 LLM 训练方法与两人博弈中代理人发展所采用的战略之间的相似之处,从博弈 - 应用于一价拍卖中出价的战略稳健学习算法
学习在重复的一价拍卖中进行投标是博弈论和机器学习之间的一个基本问题,我们提出了一种新颖的凸形式用于分析一价拍卖中的纯策略投标,并证明了我们的算法可以有效鼓励拍卖买家真实报价并且无法被巧言利用。
- 一种基于可解释机器学习的分析顾客在线数据以识别产品属性重要性的方法
利用在线顾客数据,结合人工智能和游戏理论,本研究提出了一种方法用于产品设计和市场研究,提供全面的顾客需求理解,且在多标准决策的领域中表现优于基准方法。
- $\widetilde {O}(T^{-1})$ 在全信息 General-Sum Markov Games 中收敛到(粗糙)相关均衡
使用乐观跟随正则化领导者算法结合适当的价值更新过程,在全信息一般和马尔可夫博弈中找到近似于 O (T^-1) 粗糙相关均衡。
- 利用大型语言模型进行 K 级推理
通过提出一种名为 “K 级推理” 的新型推理方法,我们在大型语言模型中加强了动态情境中的决策制定能力,并为动态推理能力的评估设定了一个坚实的定量基准。
- 以字符串形式的状态作为策略:通过博弈理论求解器驾驭语言模型
对话和游戏理论的结合,使用大型语言模型提供了生成对话和构建游戏理论解决概念的能力。
- 关于博弈论最优扑克的调查
扑克是一种不完全信息游戏,本文比较了理论最优扑克与剥削式扑克,并讨论了抽象技术、投注模型和成功扑克机器人(如 Tartanian 和 Pluribus)所使用的具体策略;同时探讨了两人对战与多人对战游戏以及在与更多玩家对战时出现的限制;最后 - 有限正规式博弈中纳什均衡算法调查
本文综合从理论和实证的角度,回顾了计算有限正规形式博弈中纳什均衡及其近似解的各种算法,并在不同类型的博弈中对这些算法进行了综合比较,并给出了关于这些算法的实现和使用的实际建议,最后从理论和实践考虑提出了一系列开放问题。
- AAAI大型语言模型能否作为博弈论中的理性参与者?一项系统分析
利用大型语言模型作为替代人类参与游戏实验的工具来进行社会科学研究时,与人类行为高度一致的特点使其具备潜力,然而,尽管已经有大量关于大型语言模型与博弈论结合的实证研究,但大型语言模型在博弈论中的能力边界仍不清楚,因此我们试图在本研究中系统分析 - 多智能体学习中的合作回顾
多智能体学习是一门涉及博弈论、经济学、社会科学和进化生物学等众多学科交叉的主题。本文概述了多智能体学习的基本概念、问题设置和算法,包括增强学习、多智能体序列决策、多智能体合作的挑战,对最近进展进行了全面综述和相关度量评估,并讨论了该领域的开 - 基于能源的潜力博弈用于联合运动预测与控制
利用博弈论作为数学框架,解决多智能体运动预测与控制中的交互建模问题。通过建立微分博弈、最优控制和基于能量的模型之间的联系,提出了基于能量的潜力博弈的统一方法,并介绍了结合神经网络进行博弈参数推断的端到端学习应用,该应用具有可解释性并通过两个 - 传感器为基础的人体活动识别中的博弈论解决方案:一综述
这篇研究论文探讨了博弈论作为解决人体活动识别(HAR)问题的潜力,通过提出新颖的博弈论方法来填补博弈论与 HAR 研究之间的鸿沟,以提高 HAR 模型的准确性和鲁棒性,优化识别算法,并与现有的 HAR 方法进行对比,旨在为基于传感器的 HA