ArAIEval 共享任务：单模态和多模态阿拉伯语内容的宣传技术检测

Jul, 2024

ArAIEval 共享任务：单模态和多模态阿拉伯语内容的宣传技术检测

ArAIEval Shared Task: Propagandistic Techniques Detection in Unimodal and Multimodal Arabic Content

Maram Hasanain, Md. Arid Hasan, Fatema Ahmed, Reem Suwaileh, Md. Rafiul Biswas...

TL;DR该研究概述了ArAIEval共享任务的第二版，任务包括检测推特和新闻文章中带有说服技巧的宣传文本，以及区分宣传性和非宣传性的表情包，参与的系统主要采用了AraBERT等细调的变压器模型。

Abstract

We present an overview of the second edition of the araieval shared task, organized as part of the ArabicNLP 2024 conference co-located with ACL 2024. In this edition, ArAIEval offers two tasks: (i) detection of propaga

发现论文，激发创造

Arap-Tweet：一个多方言 Twitter 语料库，用于性别、年龄和语言变体识别

本文介绍了 Arap-Tweet，这是一个涵盖阿拉伯世界11个地区和16个国家方言变体的大规模、多方言 Tweets 语料库，其中包括针对年龄、性别和方言变体的注释，并讨论了语料库的数据集合和标注方法，以及为阿拉伯语开发作者分析工具和 NLP 工具提供帮助的重要性。

Aug, 2018

ArAIEval共享任务传说: 使用一种语言无关的文本表示模型进行说服技巧检测

本文介绍了我们在ArabicNLP 2023的ArAIEval挑战中的最佳提交结果，我们主要关注任务1，该任务涉及从推特和新闻文章的摘录中识别说服技巧，我们使用XLM-RoBERTa进行训练，并在阿拉伯语文本中检测到说服技巧。通过微调多语言语言模型，这种方法表现出很强的效果。在测试集评估中，我们在子任务A中取得了0.64的微观F1分数。

Oct, 2023

Nexus在ArAIEval共享任务中：为宣传和虚假信息检测微调阿拉伯语言模型

在这篇论文中，我们讨论了我们参与阿拉伯语环境下ArAIEval共享任务的情况，我们在子任务1A和2A中分别获得了第9和第10的名次。我们的实验包括对转换器模型进行微调，并使用GPT-4进行零样本和少样本学习。

Nov, 2023

ArAIEval共享任务：阿拉伯语文本中的说服技巧和虚假信息检测

介绍了ArAIEval共享任务的概述，该任务主要包括通过检测推文和新闻文章中的说服技巧来识别说服技巧，并通过推文中的二进制和多类别设置来检测虚假信息。

Nov, 2023

大型语言模型的宣传划分注释

使用大型语言模型（如GPT-4）作为标注员，通过提供更多信息来改善注释一致性和性能，从而进行检测宣传性文本片段的研究。

Nov, 2023

ArAIEval共享任务中的MAVERICKS：构建更安全的数字空间 -- 转换器集成模型解决欺骗与说服

我们在本文中重点介绍了我们为《2023年阿拉伯语AI任务评估（ArAiEval）共享任务》开展的方法。我们提出了针对共享任务的任务1-A和任务2-A的方法，重点是说服技巧检测和虚假信息检测。检测说服技巧和虚假信息已成为避免真实信息扭曲的必要手段。该任务使用多种体裁的推文和新闻文章来进行给定的二元分类问题。我们尝试了在阿拉伯语上预训练的几种基于Transformer的模型，并在提供的数据集上进行了微调。我们采用集成方法来提高系统的性能。我们在任务1-A上获得了0.742的微平均F1分数（排行榜第8），在任务2-A上获得了0.901的微平均F1分数（排行榜第7）。

Nov, 2023

探索阿拉伯语中的说服技巧：利用大型语言模型的实证研究

本研究针对阿拉伯社交媒体内容，利用预训练语言模型（PLMs）进行了全面的经验研究，旨在识别其中的说服技术。通过特征提取、微调和提示工程技术三种学习方法的实验比较，得出微调方法在二分类和多标签分类任务上取得了最高结果，f1-micro分数为0.865，f1-weighted分数为0.861。此外，通过使用少样本学习技术，我们观察到在性能相对较低的GPT模型上可以提高结果达20％，这为未来的研究和探索方向提供了有希望的方向。

May, 2024

阿拉伯迷因中的宣传内容

通过为阿拉伯语模态研究开发一个包含传播性内容的阿拉伯语memes数据集，并进行了综合分析，旨在为其检测开发计算工具。

Jun, 2024

ArAIEval 共享任务中的 Nullpointer：基于序列标注中的标记到词映射的阿拉伯宣传技术检测

本文研究了阿拉伯文本中宣传技术检测的优化，包括推文和新闻段落，通过对阿拉伯评估任务1的AraBERT v2模型进行微调和使用神经网络分类器对序列标记进行了实验。实验结果表明，依靠单词的第一个标记进行技术预测可以取得最佳性能。此外，将体裁信息作为特征加入模型进一步增强了性能。我们的系统在排行榜上得分为25.41，排名第四。随后的提交改进进一步提高了我们的得分至26.68。

Jul, 2024

在ArAIEval共享任务中的MemeMind：识别阿拉伯文本中的劝说性段落及其劝说技巧

本研究旨在解决阿拉伯文本中传播性段落和劝说技巧的检测问题。通过改进的AraBERT模型和BIO标记体系，我们提出了一种新方法，能够有效识别文本中的劝说技术。研究结果表明，该方法在劝说检测任务中表现良好，F1分数达到0.2774，位列任务排行榜第3位。

Aug, 2024