评估词语情感强度在极性之前

COLINGDec, 2012

Assessing Sentiment Strength in Words Prior Polarities

Lorenzo Gatti, Marco Guerini

TL;DR该研究对情感分析中的词汇分类方法进行了探究，比较了 14 种公式的性能，选择最符合人类判断的用于计算词汇极性。

Abstract

Many approaches to sentiment analysis rely on lexica where words are tagged with their prior polarity - i.e. if a word out of context evok

sentiment analysis lexica polarity sentiwordnet prior polarities

发现论文，激发创造

情感分析：如何从 SentiWordNet 中推导出先前的极性

本文通过融合各种先前极性技术，构建一个学习框架，使用两个不同版本的 SentiWordNet，以不同的数据集和任务测试回归和分类模型，得到了优于单一指标的新一代情感分析词语 prior 极性估计方法，并发现了词语 Part of Speech 和标注者性别对计算先前极性得分的有趣偏差。

Sep, 2013

SentiWords: 情感分析高精度高覆盖率词汇表的推导

本论文提出了一种集成方法，将手动构建的先前极性词典与基于 SentiWordNet 的方法进行比较和融合，从而创建了一个在情感分析中表现出高精度和高覆盖率的先前极性词典 SentiWords，并在情感分析任务中证明了其优于 SentiWordNet 和手动标注情感词典的表现。

Oct, 2015

Twitter 上跨语言情感分类的简单方法

本文提出了一种简单易用的多语言情感分析框架，旨在作为情感分析测试基线和构建新情感分析系统的起点。该框架经过在 8 种不同语言的比较中，在其中三种语言的国际竞赛中名列前茅，在其他语言中也超越了报告的结果。

Dec, 2016

基于词典和机器学习的情感分析比较：是否存在离群词？

基于词典的情感分析方法与基于机器学习的方法对比，发现词典中的词汇对于情感得分的差异具有依赖性，而没有明显的词汇能够系统性地引起情感得分的差异。

Nov, 2023

具有对立极性的单词情感组成

本文研究了带有至少一个积极词和至少一个消极词的短语的情感组合，构建了一个对应数据集并分析其中的语言模式，并应用多种无监督和有监督技术，最终得到了一种准确率超过 80% 的最佳情感组合系统。

May, 2018

从未标记的语料库中诱导特定领域情感词典

通过使用领域特定的词向量和标签传播框架，结合少量种子单词，创造与手动资源相媲美的精准的领域特定情感词典，用于量化情感在时间和社区之间的差异，并在此基础上，提出了历史情感词汇表和社区特定情感词汇表。

Jun, 2016

揭示影响情感分析中判断变异的因素：自然语言处理和统计学

通过分析西班牙语的 TripAdvisor 评论，本研究探讨了影响众包极性判断变异的三个重要因素：词性、情感词以及中性词。研究结果表明，单词标题中的形容词倾向于导致较低的判断变异，情感词和中性词也对判断变异起到了一定的影响。然而，这些影响在更长的标题中无法复现，这暗示更长的标题并不适合用来测试单词的歧义性。这项实证研究为研究人员提供了有价值的深入了解影响单词极性变异的因素，为自然语言处理从业者利用西班牙语数据进行极性判断和预测的研究奠定了基础。

May, 2024

众包词语 - 情感关联词库

利用众智的力量，通过提出包括单词选择问题在内的 “情感注释” 问题，快速且廉价地生成了一个大型、高质量的单词 - 情感和单词极性关联词典，并通过实验证明，询问单词是否与情感相关比询问单词是否会唤起情感，获得更高的注释者互动一致性。

Aug, 2013

从关联度推断语义倾向的表扬与批评测量

该论文介绍了一种从词汇统计学关联性出发推断词汇的语义方向的方法，通过应用点对点互信息（PMI）和潜在语义分析（LSA）两种不同的统计测量方式进行评估，该方法在英语单词集测试中达到 82.8% 的准确性，但当允许算法避免类别划分时，准确性可以提高至 95% 以上。

Sep, 2003

美国：通用情感分析模型与日语情感文本分类及词性数据集的构建

利用互动增强效应以提高普通情感分析模型性能

Sep, 2023