情感分析问题尚未解决!评估和探究情感分类
我们通过对 189 篇同行评审论文在应用程序、模型和数据集方面的批判性研究,对情感分析(SA)的社会技术方面进行了探究,并从中发现情感分析已成为不同的社会技术系统的重要组成部分,对社会和技术用户产生影响。我们深入社会学和技术文献,揭示了在金融、政府和医疗等领域中对这一概念的不同概念化。我们的研究揭示了情感的明确定义和框架的缺失,从而可能带来挑战和偏见。为了解决这个问题,我们提出了一份伦理表,包含关键问题,以指导从业人员确保情感分析的公平利用。我们的发现强调了在定义 SA 中的情感方面采用跨学科方法的重要性,并为其实施提供了实用的解决方案。
Oct, 2023
提出了一个新的数据集和嵌套目标注释模式来扩展 open-domain 情感分析的实用性和有效性,运用预训练模型 BART 进行序列生成方法,结果表明 open-domain 目标情感分析领域有很大的改进空间,但是在使用 open-domain 数据、长文档、目标结构复杂性和领域差异上仍存在挑战。
Apr, 2022
本研究提出了一个基于用户评价的新型多类乌尔都数据集,旨在为乌尔都情感分析构建手动注释的数据集,并建立基准结果。使用五种不同的词库和基于规则的算法,最终实验结果表明,Flair 的准确率为 70%,优于其他测试的算法。
Jul, 2022
本章介绍了情感分析在现实生活场景中的应用和相关挑战,重点关注情感分析在健康、社会政策、电子商务、数字人文等领域的五个应用,探讨了为什么情感分析在这些领域中具有重要和挑战性,并介绍了当前情感分析研究如何处理这些应用。虽然使用深度学习技术是跨越这些应用的流行范例,但隐私和数据集选择偏差等挑战是几个应用中反复出现的主题。
Jan, 2023
本文详细阐述了情感分析的最新趋势和技术,通过系统综述了词汇、图形、网络、深度学习和规则等方法并比较分析数据集和评价指标,展现了情感分析的广泛应用领域,并旨在提高情感分析的效率和准确性。
May, 2023
本文讨论了大型语言模型在情感分析任务中的有效性,对 13 项不同的任务进行了评估,在简单任务中表现良好,但在涉及更深层次理解和结构化情感信息方面仍有待提高;然而,在资源有限的情况下,大型语言模型表现出色,提供了潜在可能性。该研究提出了一个新的基准评估框架 SentiEval。
May, 2023
现今,网站已成为展示用户对各种事件的意见、情感和感受的必要平台。使用自己的智能手机,每个人都可以在博客和社交媒体上(如 Twitter、WhatsApp、Telegram 和 Instagram)发表关于购买产品、发生事故、出现新疾病等方面的意见。因此,每天都记录了数百万条评论,这创造了大量的非结构化文本数据,可以通过自然语言处理方法从这种类型的数据中提取有用的知识。情感分析是自然语言处理和机器学习的重要应用之一,可以使我们分析评论和其他网页用户记录的文本信息的情感。因此,以下将说明在这一领域中的情感分析、方法和挑战。
Mar, 2023
通过对三个数据集:Laptops、Restaurants 和 MTSC(多目标依赖情感分类)以及这三个数据集的合并版本进行实验,研究领域多样性和句法多样性对句子难度的影响,并通过组合分类器来识别最难的句子和分析其特征。
Feb, 2024
本文中,我们提出了一种多任务学习方法,将来自句法和语义辅助任务的信息(包括否定和推测范围检测)结合起来,创建了更具鲁棒性的英语语言模型,以处理定向情感分析中的语言现象,经实验证明,基于多任务和通过语言建模的迁移学习都能提高模型性能,但总体表现仍有改进的空间。我们在此链接上发布了数据集和源代码。
Oct, 2020
本研究对二十四种正当实践的情感分析方法进行了基准比较,覆盖社交网络、电影、产品评论、新闻文章等十八个数据集,并提供了这些方法的代码和数据集以供使用。结果表明这些方法的预测性能在不同数据集上变化不大。
Dec, 2015