强化学习中自然语言状态表示概述

ICMLJul, 2020

强化学习中自然语言状态表示概述

An Overview of Natural Language State Representation for Reinforcement Learning

Brielen Madureira, David Schlangen

TL;DR本次调查综述了文献中用于构建自然语言状态表示的策略，呼吁使用更容易理解且有基础的语言表示方法、仔细评估策略及对设计决策进行详细解释。

Abstract

A suitable state representation is a fundamental part of the learning process in reinforcement learning. In various tasks, the state can either be described by →

reinforcement learning state representation natural language linguistically interpretable evaluation

发现论文，激发创造

语言即力：在强化学习中使用自然语言表示状态

研究表明使用自然语言表征的强化学习代理比视觉代理更具鲁棒性，更快收敛，表现更好，展示出使用自然语言表征的好处。

Oct, 2019

基于自然语言启发的强化学习综述

提出了将自然语言理解与强化学习紧密结合的想法，并对现有技术及未来研究方向进行了调研。

Jun, 2019

自然语言强化学习

强化学习和自然语言表示相结合的自然语言强化学习 (NLRL) 框架在解决样本效率低、解释性差、稀疏监督信号等问题方面表现出了显著的能力。通过在自然语言空间重新定义强化学习的概念和原则，以及结合大型语言模型的先进技术如 GPT-4 的实现方式，NLRL 在标签驱动的 MDPs 上的初步实验证明了该框架的有效性、效率以及可解释性。

Feb, 2024

表示抽象作为强化学习智能体的激励机制：一个机器人抓取的案例研究

选择适当的环境表示对于强化学习代理的决策过程并不总是直观的，本研究考察了不同状态表示对于激励代理解决机器人任务的影响，结果显示使用数字状态的强化学习代理与非学习基线表现相当，而使用经过预训练环境嵌入向量的图像表示的代理表现更好，推测任务特定的知识对于实现收敛和高成功率的机器人控制是必要的。

Sep, 2023

控制问题的状态表示学习综述

综述了最近几年在机器人控制任务中，涉及环境交互的各种状态表示学习方法及其应用，并重点介绍了这些算法如何利用通用学习目标。最后，讨论了评估方法以评估所学习的表示，并总结了现有和未来的研究方向。

Feb, 2018

从传统到最先进的单词表示语言模型：全面调查

本文综述了自然语言处理中的单词表示模型，介绍了从传统到现代的语言模型，包括各种文本表示方法，并讨论了这些模型在机器学习算法中的应用，以及在不同 NLP 任务中使用这些单词表示的应用。

Oct, 2020

使用深度强化学习的基于文本游戏的语言理解

本文探讨了基于文本的游戏控制策略的学习方法。该方法使用深度强化学习框架，联合学习游戏状态表示和行动策略。通过把文本转化为向量，能够更好地捕捉游戏状态的语义表示。实验结果表明，我们提出的方法显著优于传统基于词袋模型的方法。

Jun, 2015

使用深度强化学习学习状态表示以进行查询优化

研究使用深度强化学习在数据库领域中的查询优化问题，特别关注状态表征问题和状态转移函数的构建，并证明该方法在优化查询方面具有潜在的应用价值。

Mar, 2018

超越语言：句子表示的全面调查

本文综述了句子表示学习的各种方法，包括传统的和基于深度学习的技术，并对该领域的主要贡献和挑战进行了系统梳理，结论强调了句子表示学习在自然语言处理中的重要性和面临的挑战，并提出了未来研究方向和改进句子表示质量和效率的潜在途径。

May, 2023

强化学习的动作表示学习

研究了在没有给定先验结构的情况下，如何基于状态表示和行为表示实现模型无关的强化学习方法，并提供了相应的算法和收敛条件。

Feb, 2019