在蒙特卡洛框架下通过阅读手册学习获胜

Jan, 2014

在蒙特卡洛框架下通过阅读手册学习获胜

Learning to Win by Reading Manuals in a Monte-Carlo Framework

S.R.K. Branavan, David Silver, Regina Barzilay

TL;DR本文介绍了一种通过语言基础知识自动为控制算法提供指导的方法，并使用多层神经网络表示文本分析与游戏操作决策，实验证明这种基于语言知识的游戏代理系统可以显著提高控制性能和获胜概率。

Abstract

Domain knowledge is crucial for effective performance in autonomous control systems. Typically, human effort is required to encode this knowledge into a control algorithm. In this paper, we present an approach to langua

autonomous control language grounding text analysis control performance multi-layer neural network

发现论文，激发创造

互动文本游戏的知识增强代理

该文提出了一种通过注入领域知识的方式来改善基于文本游戏中的智能代理的实现过程，并考虑了多种不同的注入策略，包括知识图谱和输入编码策略的增强，实验结果在 ScienceWorld 文本游戏环境中得到证明。

May, 2023

使用深度强化学习的基于文本游戏的语言理解

本文探讨了基于文本的游戏控制策略的学习方法。该方法使用深度强化学习框架，联合学习游戏状态表示和行动策略。通过把文本转化为向量，能够更好地捕捉游戏状态的语义表示。实验结果表明，我们提出的方法显著优于传统基于词袋模型的方法。

Jun, 2015

强化学习中将语言与实体、动态相结合以实现概括

本文研究了利用自然语言来推动控制策略的泛化，并引入了一个新的多任务环境 Messenger，其中包括自由形式的文本手册，描述环境动态。使用实体 - 条件的注意力模块，作者提出了一个新的模型 EMMA，它可以从文本到观察值学习实体和动态之间的潜在关系，并实现了成功的零样本泛化。

Jan, 2021

基于接地模型指导机器人控制的文本生成

本论文提出了一种利用大型语言模型进行机器人交互的方法，用于解决理解语义知识和实现机器人任务之间的矛盾问题，其中引入了基于概率过滤的策略来采用语言模型和基于物理环境的模型两者的优势，通过指导解码策略可以实现复杂的机器人长视程任务。

Mar, 2023

感知世界：针对基于文本游戏的问题引导强化学习

本研究探讨了深度强化学习在文本游戏中的应用，提出了通过引入知觉模块以及使用两阶段训练框架来提高样本效率，从而解决了应用 DRL 的两个主要挑战。实验结果表明，提出的方法显着提高了性能和样本效率，并且对复合错误和数据有限的预训练表现出鲁棒性。

Mar, 2022

深度强化学习中的迁移语言基础

本文介绍了一种利用自然语言驱动强化学习传递的方法，并使用模型化强化学习方法和实体描述等技术，在不同环境下实现了更好的性能表现。

Aug, 2017

学习动态信念图以推广文本游戏

通过使用端到端学习的图形结构表示，我们提出一种新颖的图形辅助转换器代理（GATA），并探究其如何计划和推广文本游戏，并证明学习到的基于图形的表示有助于代理人收敛到比纯文本模型更好的策略，促进游戏配置的有效推广。

Feb, 2020

通过元学习用语言指导政策

本文提出了一种交互式的任务规范问题形式，通过自然语言指令和一系列语言修正来引导自主代理获得新技能，实现快速获取新技能，显著优于直接非交互式指令跟随。

Nov, 2018

AutoManual: 通过互动环境学习，由 LLM 代理生成指南手册

通过自动生成规则和提高适应性，AutoManual 框架使基于大型语言模型（LLM）的代理能够自主构建自身的理解并适应新的环境。在 ALFWorld 基准任务上，通过 GPT-4-turbo 和 GPT-3.5-turbo，AutoManual 显著提高了任务成功率，并生成了人可读的综合手册。

May, 2024

以基于语言模型的代码生成和行为分支为驱动的自由形式文本指令游戏智能体

本研究提出了一种具有突破性的文本命令控制系统，用于能够理解以自由形式表达的自然语言命令的游戏代理，通过使用大型语言模型（LLM）进行代码生成以将自然语言命令解释和转换为基于行为树的行为分支的知识表示，从而促进游戏代理的执行。经过模拟宝可梦游戏的游戏环境中进行的实证验证和多参与者的参与，结果确认该系统具备理解和执行自然语言命令的能力，代表了实时语言交互式游戏代理领域的引人注目进展。

Feb, 2024