基于文本游戏的深度强化学习智能体分析
本文介绍了我们设计的一种深度强化学习代理 LeDeepChef,它具有在同一游戏系列中表现良好的泛化能力。我们使用演员 - 评论家框架和分层强化学习的思想以及针对食谱数据库训练的专门模块进行了动作空间修剪。该代理在 Microsoft Research 的 “First TextWorld Problems:A Language and Reinforcement Learning Challenge” 中表现出色,并在最终测试中超过了所有选手除了一个。
Sep, 2019
本文探讨了使用基于深度强化学习的代理人在多个基于文本的游戏中进行学习,并通过策略蒸馏方法扩展其词汇,并将文本游戏用作测试平台以更详细地分析和理解策略蒸馏方法的应用。
May, 2018
本文探讨了基于文本的游戏控制策略的学习方法。该方法使用深度强化学习框架,联合学习游戏状态表示和行动策略。通过把文本转化为向量,能够更好地捕捉游戏状态的语义表示。实验结果表明,我们提出的方法显著优于传统基于词袋模型的方法。
Jun, 2015
本文提出了一种基于基于案例推理的通用方法来训练代理和实现训练分布之外的泛化,与现有文献中的 TBG 中任何现有的政策神经代理结合使用。实验表明,所提出的方法不断改进现有方法,在广泛使用的环境中获得了新的最先进结果。
Oct, 2021
本文介绍了一种基于知识图谱的 RL 代理的层次化框架,通过在高层次执行元策略将整个游戏分解为一组由文本目标指定的子任务,并通过知识图谱选择其中一个,然后在低层次执行子策略进行目标条件强化学习,实验结果表明,所提出的方法具有较好的泛化性能。
Sep, 2021
本文研究利用深度强化学习算法可玩具有组合性、稀疏奖励、有部分可观察性的文本游戏。提出了基于累积奖励的上下文化机制,缓解了部分可观测性,研究了可行动作的不同方法,并在一系列不同难度的文本游戏和 Zork 游戏中进行了实证研究,结果表明这些技术提高了基于文本游戏的深度强化学习代理的性能。
Nov, 2019
本文介绍了一种基于深度强化学习的架构,将游戏状态表示为知识图谱,通过剪枝动作空间和转移学习等技术实现了更高效的探索和学习,通过测试表明,此技术可在 TextWorld 平台上更快地学习控制策略。
Dec, 2018
本文提出了一种用于文字强化学习的探索引导推理代理 EXPLORER,通过神经符号化模块实现对未见数据的泛化并在 Text-World cooking 和 Text-World Commonsense 游戏中取得了优于基准代理的性能。
Mar, 2024
本研究探讨了深度强化学习在文本游戏中的应用,提出了通过引入知觉模块以及使用两阶段训练框架来提高样本效率,从而解决了应用 DRL 的两个主要挑战。实验结果表明,提出的方法显着提高了性能和样本效率,并且对复合错误和数据有限的预训练表现出鲁棒性。
Mar, 2022
本文通过使用 TEXT-BASED GAMES,提出了一种新的学习方法,利用视觉图像与文本信息相结合,提高了强化学习智能体的性能及其对于世界中物体及其关系的理解,从而提高了其通用性。
Jun, 2021