- 骑士不确定性游戏
游戏作为 AI 的试验平台,在 20 世纪后期和 21 世纪初被视为 AI 的研究重点,但取得的成功并未实现通用智能,因此需要能够应对游戏规则的不确定性以实现 AGI 发展和智能机器建设。
- 将组合优化引入 MCTS 方法:应用于棋盘游戏 boop
通过将组合优化注入蒙特卡罗树搜索,我们在抽象棋盘游戏中提出了一种新的 AI 方法,该方法在对强化学习算法的基线进行测试时的胜率达到 96%,并在 Board Game Arena 平台上与人类玩家对抗时取得了良好的成绩。
- 迷你王者荣耀:一种轻量级多智体强化学习环境
为了解决有限的定制性、高计算需求和过分简化等问题,我们介绍了首个公开可用的《王者荣耀》地图编辑器,并设计了一个轻量级环境 Mini Honor of Kings 供研究人员进行实验。Mini Honor of Kings 在个人电脑上运行效 - 有限游戏的几何分解:无遗憾学习下的收敛与循环
基于 Riemannian 框架和 Shahshahani 度量,在无悔学习中研究了复杂动力学的分解,发现无悔动力学在体积保持和收敛性方面具有特殊特征,并与潜势和谐波分解存在深层关联。
- 游戏中的 GPT:范围综述(2020-2023)
本论文通过 55 篇文章的综述,探讨了 GPT 在游戏中的潜力,为研究人员提供了对当前应用的全面理解,并确定了新兴趋势和未开发领域。我们确定了 GPT 在当前游戏研究中的五个关键应用:程序生成内容、混合式主动设计、混合式游戏玩法、游戏游玩和 - 玩转神经科学:神经影像学与游戏的过去、现在和未来
电子游戏对于推动人工智能、人机交互或虚拟现实等许多研究领域的进展起到了催化剂的作用。本文将分析神经科学和游戏研究之间的当前关系,并展望未来发展方向。
- 大型语言模型与游戏:调查与路线图
大语言模型(LLMs)在游戏中的应用和角色的综述和路线图,探讨了 LLMs 在游戏领域中未开发的领域和未来的发展方向。
- 使用深度强化学习和行为规范掌握官旦游戏
提出了一种名为 GuanZero 的框架,通过蒙特卡洛方法和深度神经网络使 AI 代理能够掌握 Guandan 游戏,主要贡献在于通过精心设计的神经网络编码方案调节代理的行为,通过与最先进的方法进行比较证明了该框架的有效性。
- 在遗憾匹配中平衡自我博弈训练中角色的人工智能强度
通过引入 Regret Matching + 方法,训练一种通用模型来控制游戏中的任何角色,以实现人工智能在多角色游戏中的均衡性能。
- 进化机器学习与游戏
进化机器学习已被应用于游戏的多个方面和不同目的。AI 在游戏中的研究不仅关乎玩游戏,还包括生成游戏内容、模拟玩家等多个应用,其中许多应用对于进化机器学习提出了有趣的问题。本章将根据进化是用于增强机器学习还是机器学习用于增强进化来结构化地讨论 - 情感游戏计算:一项综述
该论文综述了应用于游戏的情感计算原理、方法和工具的最新研究现状,并通过情感循环的四个核心阶段:游戏情感唤起、游戏情感感知、游戏情感检测和游戏情感适应,对这个新兴领域进行了回顾。此外,我们还提供了一个用于分类考察情感游戏循环的术语、方法和方法 - 基于游戏的人工智能研究平台
本文回顾了基于游戏的平台在人工智能研究中的应用,讨论了这些平台的演化引起的研究趋势,并展望了未来的发展。
- 伦理的棱镜视角
本文围绕伦理学展开讨论,结合游戏、表现、人工智能和社会,尝试从计算复杂性角度寻找 AI 伦理建模的相关工具和可能的未来发展方向。
- TropeTwist: 基于套路的叙述结构生成
通过该系统,我们可以使用互连的修辞手法描述游戏中的叙述结构,从而生成新的游戏叙述结构,这些结构可以通过演化来改进。
- ICML使用相关均衡元解算器进行非零和多智能体训练
提出了用于训练 n 人,广义和形博弈的 Joint Policy-Space Response Oracles (JPSRO) 算法,并建议一种有前途的元解算程序 -- 相关均衡 (correlated equilibria),并提出了最大 - 端到端游戏学习和干预
本文提出了一个通过学习和干预博弈进行端到端优化的框架,将博弈均衡作为个体层级进行整合,并提出了两种不同的方法用于学习个体的收益函数并在解决变分不等式的过程中进行反向传播。
- 学习的混沌:通过游戏分解实现零和协调之外的协作
研究发现,使用某些学习算法在若干个游戏子空间中导致了 Lyapunov 混沌现象,此现象对于游戏中的学习来说是一个重要问题,并且作者提出了一个矩阵支配的概念,设计了一个线性方案来表征使 MWU 在 Bimatrix 游戏空间中几乎处处都是 - 真实世界的游戏看起来像陀螺
本文研究现实世界游戏(如井字棋,围棋,星际争霸 II)的几何特性并证明它们与竞技场上的旋转体结构相似。此结构形成的不对称性带来了关于学习与策略的问题,我们用 9 个现实世界两人零和对称游戏进行了实证。
- OpenSpiel: 游戏中的强化学习框架
OpenSpiel 是一个用于研究通用增强学习和游戏中搜索 / 规划的环境和算法集合,支持各种类型的多人游戏和社交困境,同时包括分析学习动态和其他常见评估指标的工具。
- 一个大规模用户研究:娱乐和主观性强,但过于控制的开放域 Alexa Prize 系统
设计与评估了体现社交互动、基于故事和游戏策略的 SlugBot,参加 2018 年 AlexaPrize 的 8 强之一。收集了 10000 多次对话作为比赛的一部分,并进行了实验室后续定性评估。结果表明,故事和游戏是 SlugBot 比较