Jun, 2024

ThatiAR:阿拉伯新闻句子主观性检测

TL;DR本研究介绍了第一个用于阿拉伯语主观性检测的大型数据集,包括约 3.6K 个手动注释的句子,并基于 GPT-4o 提供解释。我们还提供了英语和阿拉伯语的说明以便进行基于 LLM 的微调,并进行了数据集、注释过程以及广泛基准测试结果的深入分析,包括预训练语言模型 (PLMs) 和 LLMs。我们的分析表明,注释者在注释过程的开始阶段受到其政治、文化和宗教背景的强烈影响。实验结果表明,具有上下文学习的 LLMs 表现更好。我们旨在向社区发布该数据集和资源。