推特情感分析:马其顿语
本文提出了一种简单易用的多语言情感分析框架,旨在作为情感分析测试基线和构建新情感分析系统的起点。该框架经过在 8 种不同语言的比较中,在其中三种语言的国际竞赛中名列前茅,在其他语言中也超越了报告的结果。
Dec, 2016
本文介绍了 TweetSentBR,即一种人工注释的,用于情感语料库的巴西葡萄牙语语料库,用于在电视节目领域的 15.000 个句子上进行分类,通过三种机器学习方法进行了基线实验并获得了良好的分类准确度。
Dec, 2017
本文介绍了用于 Marathi 语言情感分析的第一个主要公开数据集 L3CubeMahaSent,该数据集包括大约 16,000 条来自名人推特账户的推文,使用 CNN、LSTM、ULMFiT 和 BERT 等深度学习模型对其进行了基础分类结果的统计。
Mar, 2021
介绍了首个针对尼日利亚四种最常用语言(豪萨语、伊博语、尼日利亚皮钦语、约鲁巴语)的大规模人工标注推特情感数据集,并对收集、处理和标注的方法进行了说明。同时对预训练模型和迁移策略进行了评估,并发布数据集、训练模型、情感词典和代码以促进对低资源语言情感分析的研究。
Jan, 2022
本研究使用零样本和小样本学习进行跨语言情感分析。采用三种语言的 BERT-based 模型进行语种间的情感分类,提出了一种简单多任务模型。通过单任务和多任务实验的零样本和小样本场景对克罗地亚言和斯洛文尼亚情感分析进行评估。
Dec, 2022
通过提出 SemEval-2013 任务 2:Twitter 情感分析的表达级子任务和消息级子任务以及在亚马逊机械土耳其上使用众包技术标记大型 Twitter 训练数据集及其他的测试集,对情感分析在社交媒体上进行了研究。该研究因结果的准确性获得了广泛关注和讨论。
Dec, 2019
该论文介绍了阿尔巴尼亚语情感分析语料库 AlbMoRe,其中包含 800 个被标记为正面或负面的电影评论文本,并报告了使用这些样本训练的传统机器学习分类器的初步结果,可作为未来研究实验的比较基线。
Jun, 2023
本研究分析希腊,西班牙和英国国会议员的 Twitter 帖子,通过情感分析探索这些政治家的帖子是否遵循推广负面情绪以获得更高转发量的趋势,结果表明政治家的负面情绪的推文在最近时间内更广泛传播,突显情感和受欢迎程度的交集方面的有趣趋势。
Feb, 2022
本研究提出了一个基于用户评价的新型多类乌尔都数据集,旨在为乌尔都情感分析构建手动注释的数据集,并建立基准结果。使用五种不同的词库和基于规则的算法,最终实验结果表明,Flair 的准确率为 70%,优于其他测试的算法。
Jul, 2022
本文介绍了 SemEval-2020 任务 9 关于混合代码推文情感分析(SentiMix 2020)的结果,释放和描述了标记有单词级别语言识别和句子级别情感标签的 Hinglish(印地语 - 英语)和 Spanglish(西班牙语 - 英语)语料库。最好的表现是在 Hinglish 和 Spanglish 分别获得了 75.0% F1 得分和 80.6% F1 得分。观察到在比赛者中 BERT-like 模型和集合方法是最常见和成功的方法。
Aug, 2020