基于案例推理的文本强化学习通用性改善技术

ICLROct, 2021

基于案例推理的文本强化学习通用性改善技术

Case-based Reasoning for Better Generalization in Textual Reinforcement Learning

Mattia Atzeni, Shehzaad Dhuliawala, Keerthiram Murugesan, Mrinmaya Sachan

TL;DR本文提出了一种基于基于案例推理的通用方法来训练代理和实现训练分布之外的泛化，与现有文献中的 TBG 中任何现有的政策神经代理结合使用。实验表明，所提出的方法不断改进现有方法，在广泛使用的环境中获得了新的最先进结果。

Abstract

text-based games (TBG) have emerged as promising environments for driving research in grounded language understanding and studying problems like

text-based games grounded language understanding deep reinforcement learning case-based reasoning generalization

发现论文，激发创造

探索导向的文本强化学习推理

本文提出了一种用于文字强化学习的探索引导推理代理 EXPLORER，通过神经符号化模块实现对未见数据的泛化并在 Text-World cooking 和 Text-World Commonsense 游戏中取得了优于基准代理的性能。

Mar, 2024

基于文本游戏的深度强化学习智能体分析

在这篇论文中，我们构建了一个标准的无人工规则的基于文本的游戏智能体，在此环境中研究了代理设计、深度学习、评估类型和标准化等问题。

Sep, 2022

Beholder 的眼睛：基于文本的强化学习智能体的关系泛化改进

本文通过使用 TEXT-BASED GAMES，提出了一种新的学习方法，利用视觉图像与文本信息相结合，提高了强化学习智能体的性能及其对于世界中物体及其关系的理解，从而提高了其通用性。

Jun, 2021

通过分层强化学习在基于文本的游戏中实现泛化

本文介绍了一种基于知识图谱的 RL 代理的层次化框架，通过在高层次执行元策略将整个游戏分解为一组由文本目标指定的子任务，并通过知识图谱选择其中一个，然后在低层次执行子策略进行目标条件强化学习，实验结果表明，所提出的方法具有较好的泛化性能。

Sep, 2021

学习动态信念图以推广文本游戏

通过使用端到端学习的图形结构表示，我们提出一种新颖的图形辅助转换器代理（GATA），并探究其如何计划和推广文本游戏，并证明学习到的基于图形的表示有助于代理人收敛到比纯文本模型更好的策略，促进游戏配置的有效推广。

Feb, 2020

在文本游戏中计数以探索和泛化

本论文提出了一种带有片段式探索机制的循环强化学习代理，在文本游戏环境中发现良好策略。我们在一系列生成的文本游戏中展示了有希望的结果，游戏难度各异，目标是在一系列房间的末尾收集硬币。与以往的文本强化学习方法相比，我们发现我们的代理学习到可以泛化到更难的未见过游戏的策略。

Jun, 2018

基于文本的 RL 代理与常识知识：新挑战、环境和基准

本文研究了 RL 智能体如何在具备通识知识的情况下进行决策。通过设计新的基于文本的游戏环境，实现了一种感知建模的系统，同时，也为该环境提出了多个基线 RL 智能体，这些智能体能通过动态检索 ConceptNet 中相关的通识知识，实现了更好的表现。

Oct, 2020

LeDeepChef：基于深度强化学习的文本游戏 AI

本文介绍了我们设计的一种深度强化学习代理 LeDeepChef，它具有在同一游戏系列中表现良好的泛化能力。我们使用演员 - 评论家框架和分层强化学习的思想以及针对食谱数据库训练的专门模块进行了动作空间修剪。该代理在 Microsoft Research 的 “First TextWorld Problems：A Language and Reinforcement Learning Challenge” 中表现出色，并在最终测试中超过了所有选手除了一个。

Sep, 2019

运用变分因果推理泛化目标条件强化学习

利用 Causal Graph 加强了 Goal-Conditioned RL，提出了一种理论性能保证的优化框架，包括因果性发现、转换建模和策略训练的循环以提高 RL 代理的推理和泛化能力，并在九种任务上与五个基线进行了实证效果验证。

Jul, 2022

基于层叠分层注意力的深度强化学习在基于文本的游戏中的应用

本文研究了强化学习在基于文本的游戏中的应用，提出了利用知识图谱进行明确推理的方法，并通过分层注意机制构建了推理过程的显式表示，实验结果表明该方法优于现有的基于文本的代理人。

Oct, 2020