本文介绍一种采用探索和模仿学习的代理程序,能够在玩基于文本的电脑游戏时表现出最先进的性能。该方法使用 Go-Explore 探索方法以及模仿学习策略去训练模型,实现了更高效的解决文本游戏和更强的泛化能力。
Jan, 2020
本文探讨了基于文本的游戏控制策略的学习方法。该方法使用深度强化学习框架,联合学习游戏状态表示和行动策略。通过把文本转化为向量,能够更好地捕捉游戏状态的语义表示。实验结果表明,我们提出的方法显著优于传统基于词袋模型的方法。
Jun, 2015
本文介绍了一种基于知识图谱的 RL 代理的层次化框架,通过在高层次执行元策略将整个游戏分解为一组由文本目标指定的子任务,并通过知识图谱选择其中一个,然后在低层次执行子策略进行目标条件强化学习,实验结果表明,所提出的方法具有较好的泛化性能。
Sep, 2021
本文研究利用深度强化学习算法可玩具有组合性、稀疏奖励、有部分可观察性的文本游戏。提出了基于累积奖励的上下文化机制,缓解了部分可观测性,研究了可行动作的不同方法,并在一系列不同难度的文本游戏和 Zork 游戏中进行了实证研究,结果表明这些技术提高了基于文本游戏的深度强化学习代理的性能。
Nov, 2019
本论文提出了一种带有片段式探索机制的循环强化学习代理,在文本游戏环境中发现良好策略。我们在一系列生成的文本游戏中展示了有希望的结果,游戏难度各异,目标是在一系列房间的末尾收集硬币。与以往的文本强化学习方法相比,我们发现我们的代理学习到可以泛化到更难的未见过游戏的策略。
Jun, 2018
在这篇论文中,我们构建了一个标准的无人工规则的基于文本的游戏智能体,在此环境中研究了代理设计、深度学习、评估类型和标准化等问题。
Sep, 2022
该文提出了一种通过注入领域知识的方式来改善基于文本游戏中的智能代理的实现过程,并考虑了多种不同的注入策略,包括知识图谱和输入编码策略的增强,实验结果在 ScienceWorld 文本游戏环境中得到证明。
May, 2023
通过使用端到端学习的图形结构表示,我们提出一种新颖的图形辅助转换器代理(GATA),并探究其如何计划和推广文本游戏,并证明学习到的基于图形的表示有助于代理人收敛到比纯文本模型更好的策略,促进游戏配置的有效推广。
Feb, 2020
研究文本游戏在强化学习环境下的指令正确率,设计使用 Linear Temporal Logic 结构化语言支持时间上下文语义的指令,通过文字游戏的实验验证该结构化语言指令的有效性和优越性。
Nov, 2022
本文介绍了一种基于深度强化学习的架构,将游戏状态表示为知识图谱,通过剪枝动作空间和转移学习等技术实现了更高效的探索和学习,通过测试表明,此技术可在 TextWorld 平台上更快地学习控制策略。
Dec, 2018