情感分类中的主题偏见

Dec, 2023

Topic Bias in Emotion Classification

Maximilian Wegge, Roman Klinger

TL;DR我们研究了情绪语料库中存在的主题偏差以及相关的建模方法，并发现通过对抗性修正可以缓解此问题。我们的研究指出现有情绪语料库存在问题，并且需要更具代表性的资源来进行情感概念从文本中预测的公平评估。

Abstract

emotion corpora are typically sampled based on keyword/hashtag search or by asking study participants to generate textual instances. In any case, these corpora are not uniform samples representing the entirety of a domain. We hypothesize that this practice of →

emotion corpora topic bias data acquisition topic modeling adversarial correction

发现论文，激发创造

GoodNewsEveryone：一份新闻标题语料库，涵盖情感、语义角色和读者感知的注释

通过众包的方式，我们发布了一个数据集，包括了 5000 个英文新闻标题的情感、情感体验者和文本线索、相关情感原因和目标，以及读者对标题情感的感知；在此基础上，我们提出了一个多阶段的注释程序，开发了语义角色结构自动预测任务的基线，并讨论了结果，此数据集支持进一步情感分类、情感强度预测、情感原因检验和定性研究。

Dec, 2019

一项关于语音情感识别的跨语料库研究

研究了通过跨语料库和多领域训练，分类自然和表演情感的影响；结论表明，从人工情感数据集中学习信息并将其应用于多领域的自然情感识别中是可行和有效的。

Jul, 2022

Twitter 主题分类

本文针对社交媒体中讨论的各种话题，通过推文主题分类研究，提供两个相关数据集用于评估推文分类模型，并在语言模型上进行量化评估和分析。

Sep, 2022

通过反事实评估减少语言模型中的情感偏见

本文旨在量化并减少语言模型中表现出的情感偏见，该文分析了在给定的条件下（例如写作提示）和语言模型中，引起生成的文本情感发生变化的敏感属性（例如国家名称，职业，性别）的值变化的影响。我们采用公平机器学习文献中的个体和团体公正度量来量化情感偏见，并证明在两种不同的语料库（新闻文章和维基百科）上训练的大规模模型存在相当高的偏见。我们随后提出使用嵌入和情感预测导出的正则化方法，该方法应用于语言模型的潜在表示。该正则化提高了公正度量，同时保持了可比水平的困惑度和语义相似性。

Nov, 2019

多标签环境中的标签相关性利用：情感分析案例研究

论文研究了多标签情感识别模型中的标签相关性，并提出了两种建模方法和通过情感表示的成对约束作为正则化项，证明该方法在多种语言环境下具有最先进的性能和更好的稳健性。

Oct, 2022

微博情感因素的概念层面检测

本文提出了一个基于概念级别的情感原因模型（CECM），结合改进的基双词主题模型和上下文敏感的 PageRank 算法来发现热点事件在微博用户中引发多样化情绪的原因，实验结果表明 CECM 可以比基准方法更好地检测情感原因。

Apr, 2015

使用专家模型对推特中的情感进行分析

本研究提出了一种基于 Experts Model 的架构，它可以从特征向量中学习不同的特征集，有助于更好地从推文中检测情感。与基准结果和 SemEval-2018 任务 1 的前五名表现者相比，实验结果表明，我们提出的方法在情感检测问题上表现出了较好的结果。

Mar, 2019

思考视觉情绪：理解和克服数据集偏见

机器学习在视觉情感识别方面的应用具有很大的潜力，但目前的方法针对有限的视觉情感概念局限于小规模数据集上进行模型训练和测试。我们的分析确定了现有视觉情感基准测试中存在的一个长期被忽视的问题，即数据集偏见。基于我们的分析，我们提出了一个基于 Webly 监督方法的解决方案，通过利用大量的库存图像数据进行训练。我们发现，使用我们的大规模图像数据集学习的模型表现出了明显更好的泛化能力。此外，使用我们的方法学习得到的视觉表示在不同的图像和视频数据集上具有很大的潜力。

Aug, 2018

隐性设计选择对情绪识别模型开发和评估的影响

情感识别是一个复杂的任务，本论文通过多角度研究数据集、标签、建模、人口统计学和成员变量编码以及评估等方面的挑战，推进了强健、实用的情感识别模型的发展。

Sep, 2023

众包词语 - 情感关联词库

利用众智的力量，通过提出包括单词选择问题在内的 “情感注释” 问题，快速且廉价地生成了一个大型、高质量的单词 - 情感和单词极性关联词典，并通过实验证明，询问单词是否与情感相关比询问单词是否会唤起情感，获得更高的注释者互动一致性。

Aug, 2013