评估词语情感强度在极性之前
本文通过融合各种先前极性技术,构建一个学习框架,使用两个不同版本的 SentiWordNet,以不同的数据集和任务测试回归和分类模型,得到了优于单一指标的新一代情感分析词语 prior 极性估计方法,并发现了词语 Part of Speech 和标注者性别对计算先前极性得分的有趣偏差。
Sep, 2013
本论文提出了一种集成方法,将手动构建的先前极性词典与基于 SentiWordNet 的方法进行比较和融合,从而创建了一个在情感分析中表现出高精度和高覆盖率的先前极性词典 SentiWords,并在情感分析任务中证明了其优于 SentiWordNet 和手动标注情感词典的表现。
Oct, 2015
本文提出了一种简单易用的多语言情感分析框架,旨在作为情感分析测试基线和构建新情感分析系统的起点。该框架经过在 8 种不同语言的比较中,在其中三种语言的国际竞赛中名列前茅,在其他语言中也超越了报告的结果。
Dec, 2016
基于词典的情感分析方法与基于机器学习的方法对比,发现词典中的词汇对于情感得分的差异具有依赖性,而没有明显的词汇能够系统性地引起情感得分的差异。
Nov, 2023
本文研究了带有至少一个积极词和至少一个消极词的短语的情感组合,构建了一个对应数据集并分析其中的语言模式,并应用多种无监督和有监督技术,最终得到了一种准确率超过 80% 的最佳情感组合系统。
May, 2018
通过使用领域特定的词向量和标签传播框架,结合少量种子单词,创造与手动资源相媲美的精准的领域特定情感词典,用于量化情感在时间和社区之间的差异,并在此基础上,提出了历史情感词汇表和社区特定情感词汇表。
Jun, 2016
通过分析西班牙语的 TripAdvisor 评论,本研究探讨了影响众包极性判断变异的三个重要因素:词性、情感词以及中性词。研究结果表明,单词标题中的形容词倾向于导致较低的判断变异,情感词和中性词也对判断变异起到了一定的影响。然而,这些影响在更长的标题中无法复现,这暗示更长的标题并不适合用来测试单词的歧义性。这项实证研究为研究人员提供了有价值的深入了解影响单词极性变异的因素,为自然语言处理从业者利用西班牙语数据进行极性判断和预测的研究奠定了基础。
May, 2024
利用众智的力量,通过提出包括单词选择问题在内的 “情感注释” 问题,快速且廉价地生成了一个大型、高质量的单词 - 情感和单词极性关联词典,并通过实验证明,询问单词是否与情感相关比询问单词是否会唤起情感,获得更高的注释者互动一致性。
Aug, 2013
该论文介绍了一种从词汇统计学关联性出发推断词汇的语义方向的方法,通过应用点对点互信息(PMI)和潜在语义分析(LSA)两种不同的统计测量方式进行评估,该方法在英语单词集测试中达到 82.8% 的准确性,但当允许算法避免类别划分时,准确性可以提高至 95% 以上。
Sep, 2003