推文中禁止阿富汗教育情感分析
介绍了一个超过 7000 个波斯语句子的人工标注情感数据集 ——ArmanEmo,该数据集基于 Ekman 的六种基本情感和 “其他” 类别标注,同时提供了基于现代语言模型的情感分类基线模型。实验结果表明,该数据集具有超越现有波斯语情感数据集的更好泛化能力。
Jul, 2022
本文旨在评估和比较两种标记好的波斯语情感数据集(EmoPars 和 ArmanEmo)的性能,并通过使用数据增强技术、数据再平衡、类别权重和 Transformer-based Pretrained Language Models 等方法,解决数据不平衡问题,并提供了一种从高置信度样本中选择数据的策略,并在这些数据集上实现了 F1 分数的最优结果。
Nov, 2022
我们通过伊朗女性的积极作用构建的人工系统,分析波斯语 Twitter 的社会,发现 Mahsa Amini 的死触发了对性别平等的讨论。
Jul, 2023
本研究通过使用 Python 包采集 COVID-19 相关的在线帖子,并使用情感相关术语的词典将其分类为情感或中性类别,接着进行手动标注以创建 ArPanEmo 数据集,该数据集是用于阿语在线帖子的情感细粒度识别的第一个最大型数据集。
May, 2023
本论文采用词袋和 ParsBERT 进行机器学习和深度学习模型分析波斯语政治推文的情感,结果表明,使用 ParsBERT 嵌入的深度学习模型优于机器学习模型,在第一组具有三个类别的数据集上,CNN-LSTM 模型的分类精确度最高,达到 89%,在第二组具有七个类别的数据集上,分类精度为 71%,由于波斯语的复杂性,此研究的效率相对较低。
Jul, 2023
该研究提出了一种新的深度卷积神经网络模型以更有效地进行社交微博帖子中的口语文本情感分析,采用构建用户意见数据集,并使用不同的单词嵌入进行了评估,结果表明该模型具有 72%的准确性和有效性。
Jun, 2023
该研究介绍了 HurricaneEmo 情感数据集,其中包含 15,000 条带有情感的英文推文,覆盖了三个飓风: Harvey,Irma 和 Maria,并探讨了利用社交媒体平台分析灾难领域情感的挑战和价值。
Apr, 2020
我们引入和实现了一个基于混合深度学习的模型,用于对 Digikala Online 零售网站的客户评论数据进行情感分析,采用了多种深度学习网络和正则化技术作为分类器。最终,我们的混合方法在三个情感类别(积极,消极,中立)上实现了出色的性能,F1 分数达到了 78.3。
Mar, 2024
使用深度学习技术和 BERT 文本嵌入方法,对来自资源匮乏语言的有限文本数据集进行情感识别的研究,通过介绍 SmallEnglishEmotions 数据集验证了这些方法在准确分类数据集中的优越性。
Feb, 2024
研究开发了一种新的情感标注的心理健康语料库 (EmoMent),从 Sri Lanka 和印度提取了 2802 篇 Facebook 帖子 (14845 句子),并使用 RoBERTa 模型对其进行自动分类分析,证明了情感分析的潜力。
Aug, 2022