ArAIEval 共享任务:单模态和多模态阿拉伯语内容的宣传技术检测
本文介绍了 Arap-Tweet,这是一个涵盖阿拉伯世界11个地区和16个国家方言变体的大规模、多方言 Tweets 语料库,其中包括针对年龄、性别和方言变体的注释,并讨论了语料库的数据集合和标注方法,以及为阿拉伯语开发作者分析工具和 NLP 工具提供帮助的重要性。
Aug, 2018
本文介绍了我们在ArabicNLP 2023的ArAIEval挑战中的最佳提交结果,我们主要关注任务1,该任务涉及从推特和新闻文章的摘录中识别说服技巧,我们使用XLM-RoBERTa进行训练,并在阿拉伯语文本中检测到说服技巧。通过微调多语言语言模型,这种方法表现出很强的效果。在测试集评估中,我们在子任务A中取得了0.64的微观F1分数。
Oct, 2023
在这篇论文中,我们讨论了我们参与阿拉伯语环境下ArAIEval共享任务的情况,我们在子任务1A和2A中分别获得了第9和第10的名次。我们的实验包括对转换器模型进行微调,并使用GPT-4进行零样本和少样本学习。
Nov, 2023
介绍了ArAIEval共享任务的概述,该任务主要包括通过检测推文和新闻文章中的说服技巧来识别说服技巧,并通过推文中的二进制和多类别设置来检测虚假信息。
Nov, 2023
我们在本文中重点介绍了我们为《2023年阿拉伯语AI任务评估(ArAiEval)共享任务》开展的方法。我们提出了针对共享任务的任务1-A和任务2-A的方法,重点是说服技巧检测和虚假信息检测。检测说服技巧和虚假信息已成为避免真实信息扭曲的必要手段。该任务使用多种体裁的推文和新闻文章来进行给定的二元分类问题。我们尝试了在阿拉伯语上预训练的几种基于Transformer的模型,并在提供的数据集上进行了微调。我们采用集成方法来提高系统的性能。我们在任务1-A上获得了0.742的微平均F1分数(排行榜第8),在任务2-A上获得了0.901的微平均F1分数(排行榜第7)。
Nov, 2023
本研究针对阿拉伯社交媒体内容,利用预训练语言模型(PLMs)进行了全面的经验研究,旨在识别其中的说服技术。通过特征提取、微调和提示工程技术三种学习方法的实验比较,得出微调方法在二分类和多标签分类任务上取得了最高结果,f1-micro分数为0.865,f1-weighted分数为0.861。此外,通过使用少样本学习技术,我们观察到在性能相对较低的GPT模型上可以提高结果达20%,这为未来的研究和探索方向提供了有希望的方向。
May, 2024
本文研究了阿拉伯文本中宣传技术检测的优化,包括推文和新闻段落,通过对阿拉伯评估任务1的AraBERT v2模型进行微调和使用神经网络分类器对序列标记进行了实验。实验结果表明,依靠单词的第一个标记进行技术预测可以取得最佳性能。此外,将体裁信息作为特征加入模型进一步增强了性能。我们的系统在排行榜上得分为25.41,排名第四。随后的提交改进进一步提高了我们的得分至26.68。
Jul, 2024
本研究旨在解决阿拉伯文本中传播性段落和劝说技巧的检测问题。通过改进的AraBERT模型和BIO标记体系,我们提出了一种新方法,能够有效识别文本中的劝说技术。研究结果表明,该方法在劝说检测任务中表现良好,F1分数达到0.2774,位列任务排行榜第3位。
Aug, 2024