归纳式通用游戏对战
本文介绍了 GVGP 领域的通用游戏智能竞赛框架 GVGAI 及其扩展,其中涵盖了使用 VGDL 进行游戏描述的方法,以及它在研究、教育和竞赛方面的应用。同时也提到了未来计划和改进,展望了该框架在未来的潜力。
Feb, 2018
我们介绍了 GVGAI 竞赛的新领域 ——General Video Game Rule Generation 问题,该问题的解决方案是使用基于 GVGAI 软件的软件框架,给定一个游戏关卡,生成符合该关卡的游戏规则,我们描述了 API 和三种不同的规则生成器:随机生成器、构造性生成器和基于搜索的生成器,并且初步结果表明,构造性生成器生成有趣的游戏规则,但表达范围有限,而基于搜索的生成器可以生成多样化的游戏规则,但质量参差不齐。
Jun, 2019
本文研究了一个人工智能代理在玩猜谜游戏时如何受益,以便之后在诸如视觉问答(VQA)之类的新领域中表现更好,并提出了两种方法来利用猜谜游戏:一种是监督学习场景,代理学习模仿成功的猜测游戏,另一种是自我游戏,称为自我游戏通过迭代经验学习(SPIEL)。作者评估了两个过程的泛化能力,并在 CompGuessWhat?!测评工具套件上展示了评估结果。结果显示,在范围内评估中,与竞争对手相比,代理的准确率提高了 7.79 个点;在转移评估中,得益于通过 SPIEL 学习的更细粒度的对象表示,VQA 在 TDIUC 数据集上的表现在谐波平均准确度上提高了 5.31 个点。
Jan, 2021
我们开发了一种将 AlphaZero 模型适应于通用游戏对战(GGP)的方法,该方法侧重于更快的模型生成并且需要从游戏规则中提取的知识更少。数据集生成使用 MCTS 进行游戏对战,只使用值网络,并且使用注意力层替换卷积层。我们在 Regular Boardgames GGP 系统中实施了这种方法,并展示了我们可以高效地构建优于 UCT 基准的模型。
Dec, 2023
这篇论文介绍了如何将通用游戏人工智能(GVGAI)与 OpenAI Gym 环境相结合,用于测试并比较几种深度强化学习算法在各种 GVGAI 游戏上的表现,为评估游戏的相对难度提供了第一手数据。
Jun, 2018
介绍了归纳逻辑编程 (ILP) 的基本概念、学习模式、框架和几个主要系统 (Aleph,TILDE,ASPAL,和 Metagol),并概括了应用、限制和研究方向。
Aug, 2020
利用约束驱动的归纳逻辑编程系统,通过组合一组小的、不可分离的程序来学习递归程序,并且实现谓词发明,在游戏玩法和程序合成等多个领域的实验表明,该方法在预测准确率和学习时间上明显优于现有方法,有时将学习时间从一小时以上缩短到几秒钟。
Jun, 2022
通过使用端到端学习的图形结构表示,我们提出一种新颖的图形辅助转换器代理(GATA),并探究其如何计划和推广文本游戏,并证明学习到的基于图形的表示有助于代理人收敛到比纯文本模型更好的策略,促进游戏配置的有效推广。
Feb, 2020