针对突尼斯情感分析的单词表示学习
本研究介绍了 TUNIZI,一种情感分析突尼斯语阿拉伯字母表数据集,旨在开发和提高分析研究,通过社交媒体收集并由突尼斯本土讲话者手动标注准备。
Apr, 2020
本文目的在于通过情感分析依据机器学习模型对 YouTube 摩洛哥方言评论进行分类研究,在采用多种文本预处理和数据表现技术的前提下,证明深度学习模型胜于传统模型,我们达到了 90% 的准确性。
Mar, 2023
本文探讨了将 CNNs 和 LSTMs 相结合的好处,并在不同数据集上对阿拉伯语情感分析的准确性进行了改进,同时考虑了特定阿拉伯语单词的形态多样性。
Jul, 2018
本文提出了一种自动构建阿尔及利亚方言情感语料库的新方法,该语料库基于自动构建的阿尔及利亚情感词典,涉及使用阿拉伯文和阿拉伯字母拼音写成的社交媒体数据,并且取得了较好的实验结果。
Aug, 2018
社交媒体的快速发展使得我们能够分析用户意见。尽管常用语言的情感分析已经取得了显著的进展,但由于资源限制,低资源语言像阿拉伯语等仍然很少有研究。本研究探讨了 SemEval-17 和阿拉伯语情感推文数据集上的推文文本的情感分析,并研究了四种预训练语言模型以及提出了两种集成语言模型。我们的发现包括单语言模型表现出更好的性能,集成模型优于基线,而多数投票集成模型胜过英语。
Mar, 2024
本研究在于使用阿拉伯语拉丁写法(Arabizi)对突尼斯阿拉伯语进行编码,在此基础上创建了一个包含语料库和 NLP 工具的资源,用于提供各级语言信息的词语分类、音译、标记、词形归总等,并讨论了使用计算和语言方法进行研究路径和实验的策略等问题,最终提供了可能广泛用于计算和语言研究的资源。
Jul, 2022
本研究提出了一种可解释的情感分类框架,通过在双向长短期记忆(BiLSTM)和卷积神经网络(CNN)-BiLSTM 模型上引入噪声层,克服了过拟合问题,实验证明添加噪声层可以提高阿拉伯语情感分析的性能。
Sep, 2023
该研究通过使用六种语言模型并采用迁移学习和微调技术,开发了用于 14 种不同非洲语言情感分析的多语言模型,最终在开发和测试数据中取得了 F1 得分。结果表明跨多种语言的情感分析可以通过迁移学习和微调技术实现,该方法可以应用于其他语言和领域的情感分析任务。
Apr, 2023
本论文采用词袋和 ParsBERT 进行机器学习和深度学习模型分析波斯语政治推文的情感,结果表明,使用 ParsBERT 嵌入的深度学习模型优于机器学习模型,在第一组具有三个类别的数据集上,CNN-LSTM 模型的分类精确度最高,达到 89%,在第二组具有七个类别的数据集上,分类精度为 71%,由于波斯语的复杂性,此研究的效率相对较低。
Jul, 2023
本文旨在提出两种深度学习架构以及数据增强技术来分类波斯语句子的多分类和二分类情感,实验结果表明我们提出的方法可以成功地解决此问题。
Apr, 2020