学习生成评论及发现情感

Apr, 2017

Learning to Generate Reviews and Discovering Sentiment

Alec Radford, Rafal Jozefowicz, Ilya Sutskever

TL;DR本文探讨了字节级循环语言模型的性质和学习特征，这些特征包括对应于高级概念的分离特征和单元，其中一个单元执行情感分析，这些在非监督学习方式下得到的表述在斯坦福情感树库的二进制子集上实现了最先进的性能，同时也具有很高的数据效率。

Abstract

We explore the properties of byte-level recurrent language models. When given sufficient amounts of capacity, training data, and compute time, the representations learned by these models include disentangled features corresponding to high-level concepts. Specifically, we find a single

byte-level recurrent language models sentiment analysis unsupervised learning data efficiency generative models

发现论文，激发创造

大语言模型中情感的线性表征

在这项研究中，我们发现情感在大型语言模型中以线性方式表示，通过因果干预，我们证明情感表示在特定方向是有因果关系的。此外，我们揭示了情感表示涉及的注意力和神经元的机制，并发现了一种名为 “summarization motif” 的现象，其中情感不仅仅在情绪化的词汇上表示，也在中性位置（如标点符号和名称）进行总结。我们还展示了在 Stanford Sentiment Treebank 的零样本分类任务中，当去除情感方向时，几乎有 36% 的总分类准确度损失是由于在逗号位置去除总结性情感方向造成的。

Oct, 2023

语言规范化 LSTMs 用于情感分类

本研究提出了使用句子级别注释训练的简单模型，同时采用正则化方法，以模拟情感词汇、否定词和强度词汇的语言学角色，从而生成语言学相关的表示形式，并且能够捕捉情感、否定和强度词汇的情感转移效应，同时在不损失模型简洁性的前提下获得竞争性的结果。

Nov, 2016

基于层次模型的方面情感分析

通过建模评论中的句子之间的相互依赖关系，我们提出了一种基于分层双向 LSTM 的情感分析方法，在五个多语种、多领域的数据集上取得了竞争状态下最先进结果，并优于其它两种基线模型，而且不需要使用手工特征或外部资源。

Sep, 2016

基于生成模型和鉴别模型的电影评论情感分析集成

本文比较了多种机器学习方法以实现情感分析，并将它们结合起来以实现最佳结果，结果表明，很容易重现，这将简化进一步发展状态的艺术，因为其他研究人员可以轻松地将他们的技术与我们的技术相结合。

Dec, 2014

多语言情感分析：一种基于循环神经网络的有限数据框架

该研究旨在解决情感分析在不同语言中的多种语言依赖性问题，通过使用递归神经网络训练英文评论以建立一个主要用于英语的情感分析模型，并在俄语、西班牙语、土耳其语和荷兰语等其他语言中重复使用此模型来评估情绪，结果表明该方法在多语言情感分析中表现出色。

Jun, 2018

一个思想的内在情感

本文探讨了基于 Transformer 的大规模语言模型中，情感表示的内部机制以及情感分析。研究利用模型对情感分布量化，提出了针对积极、消极、决定、钦佩、焦虑和烦躁等情感的预测器，并且提出了预测分布以生成表达极端情感的句子，这些研究对思考内部机制和心理障碍的影响具有启示性。

Jul, 2023

潜在变量情感语法

本文研究了使用神经模型对组分树进行情感分类。在研究中探索了两种深度情感表达的形式，分别是通过潜变量和高斯混合向量来捕捉情感子类型表达的形式。实验表明，使用我们的方法，结合 ELMo 嵌入，可以在 Stanford 情感树库 (SST) 上取得最佳结果。

Jun, 2019

通过反事实评估减少语言模型中的情感偏见

本文旨在量化并减少语言模型中表现出的情感偏见，该文分析了在给定的条件下（例如写作提示）和语言模型中，引起生成的文本情感发生变化的敏感属性（例如国家名称，职业，性别）的值变化的影响。我们采用公平机器学习文献中的个体和团体公正度量来量化情感偏见，并证明在两种不同的语料库（新闻文章和维基百科）上训练的大规模模型存在相当高的偏见。我们随后提出使用嵌入和情感预测导出的正则化方法，该方法应用于语言模型的潜在表示。该正则化提高了公正度量，同时保持了可比水平的困惑度和语义相似性。

Nov, 2019

一种少样本情感分析的生成语言模型

本篇论文研究了使用预训练语言模型在情感分析任务，尤其是针对少量数据的方面 - 基础情感分析，提出了一种生成式语言模型来处理抽取方面、抽取类别、预测极性等任务，并证明了这种方法在多任务、少样本学习上比以前的方法有更好的表现。

Apr, 2022

评估当前最优情感模型在当前最优情感数据集上的表现

本文通过在六个不同的基准上比较多个模型，展示了 Bi-LSTMs 在不同数据集上都有出色表现，并说明 LSTMs 和 Bi-LSTMs 对于多分类细粒度情感任务非常适用。此外，文章还指出，在训练过程中将情感信息融入词嵌入向量可以显著提高与训练数据相似的数据集的效果，有效促进了不同模型结构在不同数据集上的性能的理解和研究。

Sep, 2017