可理解的基于上下文的文本游戏

May, 2019

Comprehensible Context-driven Text Game Playing

Xusen Yin, Jonathan May

TL;DR本文提出了将位置和语法定向结构从文本中提取并使用快速卷积神经网络编码为状态的方法，并以通用和实用的方式增强奖励信号，以加快计算机智能体训练速度和提高其质量。

Abstract

In order to train a computer agent to play a text-based computer game, we must represent each hidden state of the game. A Long Short-Term Memory (LSTM) model running over observed texts is a common choice for state construction. However, a normal Deep Q-learning Network (DQN) for such

computer agent long short-term memory (lstm)deep q-learning network (dqn)convolutional neural network (cnn)reward signal

发现论文，激发创造

深度强化学习生成文本

提出了一种基于深度强化学习（Deep Q-Network, DQN）的序列到序列学习中，通过迭代的方式对输出序列进行解码的新型模式，旨在使解码器优先处理较为容易的序列部分，然后再处理较为困难的部分。

Oct, 2015

开放式视觉问答

研究使用深度学习框架解决视觉问答任务的方法，探索 LSTM 网络和 VGG-16、K-CNN 卷积神经网络提取图像特征，将其与问题的词嵌入或句子嵌入相结合进行答案预测。在 Visual Question Answering Challenge 2016 中获得了 53.62％的准确率。

Oct, 2016

使用深度强化学习的基于文本游戏的语言理解

本文探讨了基于文本的游戏控制策略的学习方法。该方法使用深度强化学习框架，联合学习游戏状态表示和行动策略。通过把文本转化为向量，能够更好地捕捉游戏状态的语义表示。实验结果表明，我们提出的方法显著优于传统基于词袋模型的方法。

Jun, 2015

多尺度下神经语言建模分析

本论文通过对现有 LSTMs 和 QRNNs 语言模型的扩展，提高了对大型语料库的处理能力，并在字符级（Penn Treebank，enwik8）和单词级（WikiText-103）数据集上分别取得了最新的最高水平结果，而且只用了一台现代 GPU，最快只需 12 小时（WikiText-103）或 2 天（enwik8）即可。

Mar, 2018

长短时记忆网络自动规则提取

本文提出了一种新方法，通过追踪给定输出对 LSTM 的给定输入的重要性来识别一致重要的单词模式，从而将其简化为一组代表性短语，并基于这些短语构造了一个简单的基于规则的分类器，从而近似于 LSTM 在情感分析和问题回答上的输出。

Feb, 2017

一种用于文本分类的 C-LSTM 神经网络

本文提出 C-LSTM 模型，结合了 CNN 和 RNN 的优点，用于句子表示和文本分类，实验结果表明 C-LSTM 比 CNN 和 LSTM 表现更好，可在这些任务中取得出色的性能。

Nov, 2015

学习文本浏览

本文针对 RNN 读取长文本过慢的问题，提出一种改进的 LSTM 模型，在保持相同或者更好的准确性的情况下，速度比标准的序列 LSTM 快多达 6 倍，适用于数字预测、情感分析、新闻文章分类和自动问答任务。

Apr, 2017

重新审视文字游戏中的 “文字” 角色

本文研究了文本在不同强化学习问题中的作用，并提出一种简单的策略，通过提取相关的上下文信息来作为 RNN-based 文本代理的额外输入，实现了与新颖的自然语言理解技术相当的性能，这表明非自然语言理解技术也能够足以解决部分可观察性的挑战。

Oct, 2022

使用自然语言行动空间的深度强化学习

本文介绍了一种新的强化学习体系架构，它是专门设计用于处理自然语言状态和动作空间，适用于文本类型游戏。该体系架构称为深度强化相关网络（DRRN），可以将动作和状态空间表示为独立的嵌入向量，并通过交互函数与 Q 函数一起拟合以实现强化学习。在两个受欢迎的文本游戏上对 DRRN 进行评估，表现优于其他深度 Q 学习体系架构。对具有不同措辞的动作描述进行的实验表明，该模型在提取意义而非仅仅是记忆文本串方面表现出色。

Nov, 2015

检测对话环境中的上下文相关消息

该研究旨在解决聊天机器人系统中当需要考虑自然语言上下文的情况及使用长短时记忆网络学习分类器的问题，并取得了显著的分类准确性提升。

Nov, 2016