YNU-HPCC 在 SemEval2020 任务 11 中：使用 LSTM 网络检测新闻文章中的宣传技术

Aug, 2020

YNU-HPCC 在 SemEval2020 任务 11 中：使用 LSTM 网络检测新闻文章中的宣传技术

YNU-HPCC at SemEval-2020 Task 11: LSTM Network for Detection of Propaganda Techniques in News Articles

Jiaxu Dao, Jin Wang, Xuejie Zhang

TL;DR这篇论文总结了我们对 SemEval-2020 任务 11 中新闻文章宣传检测技术的研究，我们使用 GloVe、BERT 和 LSTM 模型结构实现了此任务，并且在 SI 和 TC 子任务中取得了良好的结果，超越了官方基线方法的性能，与测试集的排名分别为第 17 和第 22 名，并比较了不同的深度学习模型结构在新闻宣传检测上的性能。

Abstract

This paper summarizes our studies on propaganda detection techniques for news articles in the SemEval-2020 task 11. This task is divided into the SI and TC subtasks. We implemented the glove word representation,

propaganda detection glove bert lstm deep learning models

发现论文，激发创造

CyberWallE 在 SemEval-2020 Task 11 中：针对宣传检测的集成模型的特征工程分析

本篇论文介绍了我们在 SemEval-2020 挑战赛 “新闻文章中宣传技巧检测” 的参赛结果，我们使用 bi-LSTM 体系结构进行子任务 Span Identification（SI）和使用复杂的 ensemble model 进行子任务 Technique Classification（TC），并使用 BERT 嵌入，附加词汇特征和标签后处理等，最后在两个子任务中均取得了不错的成绩。

Aug, 2020

SemEval-2020 任务 11：新闻文章中的宣传技术检测

本文介绍了 SemEval-2020 任务 11 的研究结果和主要发现，该任务主要是探测新闻文章中的宣传技术。该任务由两个子任务组成，分别是文本片段的位置识别和宣传技术的分类。该任务吸引了 250 个团队的参与，最优解为使用预训练转换器和合奏的方法。

Sep, 2020

新闻中细粒度宣传检测的神经网络结构

本篇论文详细介绍我们系统 (MIC-CIS) 参加 2019 年细粒度宣传检测共享任务的结果与细节。为解决句子级别 (SLC) 和片段级别 (FLC) 宣传检测任务，我们针对不同的神经架构 (e.g., CNN, LSTM-CRF 和 BERT) 以及提取语言学 (e.g., 词性、命名实体、可读性、情感等)、版面和主题特征进行了探索。具体而言，我们设计了多粒度与多任务的神经架构来共同执行句子和片段级别宣传检测。此外，我们还研究了不同的集成方案，如多数投票、宽松投票等，以提高整个系统的性能。与其他参与系统相比，我们的提交在 FLC 和 SLC 任务中分别排名第 3 和第 4。

Sep, 2019

SemEval-2020 任务 11 中的 BPGC：基于多粒度知识共享和语言特征的集成学习在新闻文章中探测宣传

SemEval 2020 Task-11 aims to design automated systems for news propaganda detection, consisting of two sub-tasks, utilizing contextual embeddings and an ensemble of BERT and logistic regression classifiers with linguistic features to identify propaganda techniques and classify propagandist statements respectively.

May, 2020

QCRI-MIT 团队在 SemEval-2019 任务 4 中：宣传分析与超极端新闻检测相遇

本文报道了我们在 SemEval-2019 任务 4 中提出的超级党派新闻检测系统，该系统主要使用一些原本用于检测宣传的工程特征。我们训练了一个基于逻辑回归模型的分类器，并使用从简单单词袋到词汇丰富度和文本可读性等特征来训练它。我们的系统在手动注释的测试数据上实现了 72.9% 的准确率，而在带有远程监督标注的测试数据上则实现了 60.8% 的准确率。另外的实验表明，使用更好的特征预处理可以大幅提高性能。

Apr, 2019

大型语言模型用于宣传检测

探测在数字化社会中广告宣传的普及给社会和真相的传播带来了挑战，通过 NLP 在文本中检测广告宣传是具有挑战性的，我们研究了现代大型语言模型（LLMs）如 GPT-3 和 GPT-4 在广告宣传检测中的有效性，并对使用 SemEval-2020 任务 11 数据集进行了实验，该数据集的新闻文章被标记为 14 种广告宣传技术的多标签分类问题，使用了五种不同的 GPT-3 和 GPT-4 变体，其中包括不同模型之间的各种提示工程和微调策略，通过评估 $F1$ 分数，$Precision$ 和 $Recall$ 等指标来评估模型的性能，并将结果与使用 RoBERTa 的当前最先进方法进行比较，我们的研究结果表明 GPT-4 达到了与当前最先进方法相当的结果，此外，本研究分析了 LLMs 在复杂任务如广告宣传检测中的潜力和挑战。

Oct, 2023

Inno 在 SemEval-2020 任务 11 中：利用纯 Transformer 进行多类别宣传检测

本文提出了基于 Transformer 模型的优化学习方案，用于检测新闻文章中的宣传技术，并在验证集和测试集上展示了不低于 0.6 和 0.58 的总 F1 得分，以及每个类别上的非零 F1 得分。

Aug, 2020

大型语言模型用于多标签宣传检测

本研究通过提出的五种模型集成方法，针对包含 21 种宣传技巧的多标签文本分类任务有效地识别互联网宣传。最终在 WANLP 2022 共享任务中获得 59.73% 的微型 F1 分数，并进一步提出了未来的研究方向。

Oct, 2022

NLP4IF-2019 共享任务：细粒度宣传检测结果

该研究介绍了细粒度宣传检测的共享任务，分别有片段级别任务和句子级别任务，并在 NLP4IF 会议上举办，最终 12 个团队提交了 FLC 任务的系统，在 SLC 任务上有 25 个团队，其中 14 个队伍提交了系统描述论文。

Oct, 2019

IITD 在 WANLP 2022 共享任务中：用于宣传检测的多语言多粒度网络

使用 XLM-R 模型预测给定推文中每个宣传技术的概率，运用多粒度神经网络与 mBERT 编码器，基于大规模阿拉伯语数据集进行多标签分类及序列标注任务，该方法在 WANLP'2022 的两项子任务中获得第二名。

Oct, 2022