本篇论文主要介绍了我们的方法来解决文本冒险游戏中需要理解自然语言并在游戏中表现出智能行为的代理问题。我们的代理 Golovin 利用游戏领域的限制,利用相关文献和游戏来创建适用于该领域的语言模型。此外,我们还嵌入了机制,以便我们可以指定和分别处理重要的任务,如对手作战,管理库存和在游戏地图上导航,并通过测量代理在 50 个互动小说游戏集中的表现来验证了这些机制的有效性。最后,我们展示了我们的代理在 Text-Based Adventure AI 比赛中使我们获得了与去年获胜者相当的成绩。
May, 2017
本文介绍一种采用探索和模仿学习的代理程序,能够在玩基于文本的电脑游戏时表现出最先进的性能。该方法使用 Go-Explore 探索方法以及模仿学习策略去训练模型,实现了更高效的解决文本游戏和更强的泛化能力。
Jan, 2020
本文探讨了使用基于深度强化学习的代理人在多个基于文本的游戏中进行学习,并通过策略蒸馏方法扩展其词汇,并将文本游戏用作测试平台以更详细地分析和理解策略蒸馏方法的应用。
May, 2018
该文提出了一种通过注入领域知识的方式来改善基于文本游戏中的智能代理的实现过程,并考虑了多种不同的注入策略,包括知识图谱和输入编码策略的增强,实验结果在 ScienceWorld 文本游戏环境中得到证明。
May, 2023
介绍了 Jericho,IF 游戏的学习环境,并通过对丰富游戏集合上的文本代理进行全面研究,强调了代理可以提高的方向。
Sep, 2019
本文介绍了一项基于《上古卷轴》中的双人卡牌游戏的 AI 挑战赛,目标在于开发应对随机性、信息不对称、策略多样等多种挑战的 AI 算法,该比赛旨在鼓励使用经典对抗搜索、单人策略规划和神经网络等多种算法进行游戏策略实现,是 CCG 领域中首次针对卡组构筑的 AI 挑战赛。
介绍第六届 AIBIRDS 比赛,要求参赛者开发智能代理程序,能够玩物理学基础碎片游戏 Angry Birds,并使用深度强化学习等技术,描述该比赛的框架,规则,参赛代理程序和结果,探讨相关工作和未来的发展方向。
Mar, 2018
本文研究利用深度强化学习算法可玩具有组合性、稀疏奖励、有部分可观察性的文本游戏。提出了基于累积奖励的上下文化机制,缓解了部分可观测性,研究了可行动作的不同方法,并在一系列不同难度的文本游戏和 Zork 游戏中进行了实证研究,结果表明这些技术提高了基于文本游戏的深度强化学习代理的性能。
Nov, 2019
本文研究使用马尔可夫模型和神经生成模型,在以厨艺为例的语境中,为文本冒险游戏(Interactive fictions)自动生成任务目标序列,评估两个任务生成技术在语义上的连贯性和创造性。
本文介绍了一种基于深度强化学习的架构,将游戏状态表示为知识图谱,通过剪枝动作空间和转移学习等技术实现了更高效的探索和学习,通过测试表明,此技术可在 TextWorld 平台上更快地学习控制策略。
Dec, 2018