YNU-HPCC 在 SemEval2020 任务 11 中:使用 LSTM 网络检测新闻文章中的宣传技术
本篇论文介绍了我们在 SemEval-2020 挑战赛 “新闻文章中宣传技巧检测” 的参赛结果,我们使用 bi-LSTM 体系结构进行子任务 Span Identification(SI)和使用复杂的 ensemble model 进行子任务 Technique Classification(TC),并使用 BERT 嵌入,附加词汇特征和标签后处理等,最后在两个子任务中均取得了不错的成绩。
Aug, 2020
本文介绍了 SemEval-2020 任务 11 的研究结果和主要发现,该任务主要是探测新闻文章中的宣传技术。该任务由两个子任务组成,分别是文本片段的位置识别和宣传技术的分类。该任务吸引了 250 个团队的参与,最优解为使用预训练转换器和合奏的方法。
Sep, 2020
本篇论文详细介绍我们系统 (MIC-CIS) 参加 2019 年细粒度宣传检测共享任务的结果与细节。为解决句子级别 (SLC) 和片段级别 (FLC) 宣传检测任务,我们针对不同的神经架构 (e.g., CNN, LSTM-CRF 和 BERT) 以及提取语言学 (e.g., 词性、命名实体、可读性、情感等)、版面和主题特征进行了探索。具体而言,我们设计了多粒度与多任务的神经架构来共同执行句子和片段级别宣传检测。此外,我们还研究了不同的集成方案,如多数投票、宽松投票等,以提高整个系统的性能。与其他参与系统相比,我们的提交在 FLC 和 SLC 任务中分别排名第 3 和第 4。
Sep, 2019
SemEval 2020 Task-11 aims to design automated systems for news propaganda detection, consisting of two sub-tasks, utilizing contextual embeddings and an ensemble of BERT and logistic regression classifiers with linguistic features to identify propaganda techniques and classify propagandist statements respectively.
May, 2020
本文报道了我们在 SemEval-2019 任务 4 中提出的超级党派新闻检测系统,该系统主要使用一些原本用于检测宣传的工程特征。我们训练了一个基于逻辑回归模型的分类器,并使用从简单单词袋到词汇丰富度和文本可读性等特征来训练它。我们的系统在手动注释的测试数据上实现了 72.9% 的准确率,而在带有远程监督标注的测试数据上则实现了 60.8% 的准确率。另外的实验表明,使用更好的特征预处理可以大幅提高性能。
Apr, 2019
探测在数字化社会中广告宣传的普及给社会和真相的传播带来了挑战,通过 NLP 在文本中检测广告宣传是具有挑战性的,我们研究了现代大型语言模型(LLMs)如 GPT-3 和 GPT-4 在广告宣传检测中的有效性,并对使用 SemEval-2020 任务 11 数据集进行了实验,该数据集的新闻文章被标记为 14 种广告宣传技术的多标签分类问题,使用了五种不同的 GPT-3 和 GPT-4 变体,其中包括不同模型之间的各种提示工程和微调策略,通过评估 $F1$ 分数,$Precision$ 和 $Recall$ 等指标来评估模型的性能,并将结果与使用 RoBERTa 的当前最先进方法进行比较,我们的研究结果表明 GPT-4 达到了与当前最先进方法相当的结果,此外,本研究分析了 LLMs 在复杂任务如广告宣传检测中的潜力和挑战。
Oct, 2023
本文提出了基于 Transformer 模型的优化学习方案,用于检测新闻文章中的宣传技术,并在验证集和测试集上展示了不低于 0.6 和 0.58 的总 F1 得分,以及每个类别上的非零 F1 得分。
Aug, 2020
本研究通过提出的五种模型集成方法,针对包含 21 种宣传技巧的多标签文本分类任务有效地识别互联网宣传。最终在 WANLP 2022 共享任务中获得 59.73% 的微型 F1 分数,并进一步提出了未来的研究方向。
Oct, 2022
该研究介绍了细粒度宣传检测的共享任务,分别有片段级别任务和句子级别任务,并在 NLP4IF 会议上举办,最终 12 个团队提交了 FLC 任务的系统,在 SLC 任务上有 25 个团队,其中 14 个队伍提交了系统描述论文。
Oct, 2019
使用 XLM-R 模型预测给定推文中每个宣传技术的概率,运用多粒度神经网络与 mBERT 编码器,基于大规模阿拉伯语数据集进行多标签分类及序列标注任务,该方法在 WANLP'2022 的两项子任务中获得第二名。
Oct, 2022