情感分类中的主题偏见
通过众包的方式,我们发布了一个数据集,包括了 5000 个英文新闻标题的情感、情感体验者和文本线索、相关情感原因和目标,以及读者对标题情感的感知;在此基础上,我们提出了一个多阶段的注释程序,开发了语义角色结构自动预测任务的基线,并讨论了结果,此数据集支持进一步情感分类、情感强度预测、情感原因检验和定性研究。
Dec, 2019
本文旨在量化并减少语言模型中表现出的情感偏见,该文分析了在给定的条件下(例如写作提示)和语言模型中,引起生成的文本情感发生变化的敏感属性(例如国家名称,职业,性别)的值变化的影响。我们采用公平机器学习文献中的个体和团体公正度量来量化情感偏见,并证明在两种不同的语料库(新闻文章和维基百科)上训练的大规模模型存在相当高的偏见。我们随后提出使用嵌入和情感预测导出的正则化方法,该方法应用于语言模型的潜在表示。该正则化提高了公正度量,同时保持了可比水平的困惑度和语义相似性。
Nov, 2019
论文研究了多标签情感识别模型中的标签相关性,并提出了两种建模方法和通过情感表示的成对约束作为正则化项,证明该方法在多种语言环境下具有最先进的性能和更好的稳健性。
Oct, 2022
本文提出了一个基于概念级别的情感原因模型(CECM),结合改进的基双词主题模型和上下文敏感的 PageRank 算法来发现热点事件在微博用户中引发多样化情绪的原因,实验结果表明 CECM 可以比基准方法更好地检测情感原因。
Apr, 2015
本研究提出了一种基于 Experts Model 的架构,它可以从特征向量中学习不同的特征集,有助于更好地从推文中检测情感。与基准结果和 SemEval-2018 任务 1 的前五名表现者相比,实验结果表明,我们提出的方法在情感检测问题上表现出了较好的结果。
Mar, 2019
机器学习在视觉情感识别方面的应用具有很大的潜力,但目前的方法针对有限的视觉情感概念局限于小规模数据集上进行模型训练和测试。我们的分析确定了现有视觉情感基准测试中存在的一个长期被忽视的问题,即数据集偏见。基于我们的分析,我们提出了一个基于 Webly 监督方法的解决方案,通过利用大量的库存图像数据进行训练。我们发现,使用我们的大规模图像数据集学习的模型表现出了明显更好的泛化能力。此外,使用我们的方法学习得到的视觉表示在不同的图像和视频数据集上具有很大的潜力。
Aug, 2018
情感识别是一个复杂的任务,本论文通过多角度研究数据集、标签、建模、人口统计学和成员变量编码以及评估等方面的挑战,推进了强健、实用的情感识别模型的发展。
Sep, 2023
利用众智的力量,通过提出包括单词选择问题在内的 “情感注释” 问题,快速且廉价地生成了一个大型、高质量的单词 - 情感和单词极性关联词典,并通过实验证明,询问单词是否与情感相关比询问单词是否会唤起情感,获得更高的注释者互动一致性。
Aug, 2013