一份用于政治标题目标情感分析的西班牙数据集
这篇论文研究了新闻文章情感分析的不同点,并且提出了三个需要解决的子任务,同时尝试从新闻文章中分离出正负面情感并挖掘其中的实体,最终得到的实验结果表明,忽略专业领域的词汇能够在新闻观点挖掘的任务中产生更好的效果。
Sep, 2013
利用 “翻译 - 检索 - 翻译” 策略引入推理通识知识,然后将其整合到多语言预训练语言模型中以预测政治极性,证明我们的框架不受所使用的模型的影响,并具有潜力为新闻从业者、社会科学家、新闻制作人员和消费者带来好处。
Dec, 2022
本文提出了一种基于推文训练的两步分类方案,用于检测长文本中的政治偏见。该方案包括通过推特数据训练中性检测器,用于去除文章中的中性句子以实现意见集中,并提高了文章的预测准确性。
Sep, 2019
在这项工作中,我们关注通过理解文本的上下文来自动识别给定在线报纸的政治意图。为了解决这个问题,我们提出了一个新颖的韩文文本分类数据集,其中包含各种文章,并提供了在该数据集上训练的基于深度学习的文本分类基线模型。
Nov, 2023
本文介绍一种基于情感分析的新数据集以及依此数据集进行的一系列实验,重点是训练一个强大的情感分类器用于议会会议。此外,还引入了第一个领域特定的 LLM(语言模型)用于政治科学应用,并在 27 个欧洲议会的会议记录中进行了 1.72 亿专业领域词汇的预训练。通过实验证明,LLM 在议会数据上的额外预训练可以显著提高模型的性能,尤其是在情感检测等具体领域任务上。同时,该研究显示多语言模型在未知语言上表现良好,并且来自其他语言的额外数据显著提高了目标议会的结果。本文对社会科学的多个领域做出了重要贡献,并将其与计算机科学和计算语言学相结合。最后,它建立了一种更可靠的政治文本情感分析方法,使学者能够使用标准化的工具和技术,从比较的视角研究政治情感。
Sep, 2023
本研究旨在利用目标情感分析从给定的文本中提取针对特定目标的情感,我们提供了适用于目标情感分析的标注土耳其数据集,并提出了基于 BERT 的模型,结果表明,与传统情感分析模型相比,所提出的模型具有更好的性能。
May, 2022
本文介绍了一项新的 NLP 任务,名为 directed sentiment extraction,可用于计算社会科学中分析政治性新闻文本中谁责备或支持谁的情感方向。该方法利用预训练变压器神经网络进行目标分类预测,并结合多种问题回答任务的结果。通过分析美国总统选举和 COVID-19 等两个事件中政治实体之间的正面和负面意见,证明了该方法的实用性,可促进未来 NLP 方法和应用的跨学科研究。
Jun, 2021
利用一种简单的框架将政治意识形态表示为对一组主题的情感极性分布并利用此表示法分析文档中的意识形态倾向,实验证明该方法可实现与其他方法相当的性能,且更简单易解释。
Oct, 2018
本文通过收集来自 MercadoLibre 网站七个国家的商品评论,建立了一个大型且平衡的数据集,研究了一个基于该数据集训练的情感分类系统在泛化到不同西班牙语领域的能力,结果表明该分类系统的泛化能力有一定可行性,但需要使用预训练和微调技术进行改进。
Mar, 2023
PerSenT 数据集包括了新闻文章中主要实体的情感分析,并提供了段落级别的情感注释以提供更精细的监督。该数据集的基准测试表明,这是一项困难的分类任务。该论文指出,使用 BERT 对文档级表示进行微调是不足够的,并且对整个文档进行段落级别的决策和聚合也是无效的。该数据集包含 5.3k 个文档和 38k 个段落,涵盖 3.2k 个独特的实体,是实体情感分析中的一个挑战。
Nov, 2020