层次多实例多标签学习在检测宣传技术中的应用

May, 2023

层次多实例多标签学习在检测宣传技术中的应用

Hierarchical Multi-Instance Multi-Label Learning for Detecting Propaganda Techniques

Anni Chen, Bhuwan Dhingra

TL;DR本文提出了一种基于 RoBERTa 的 Multi-Instance Multi-Label（MIML）模型，以同时分类文章中的所有内容片段，考虑了标签之间的层级关系，取得了领先的分类效果。

Abstract

Since the introduction of the SemEval 2020 Task 11 (Martino et al., 2020a), several approaches have been proposed in the literature for classifying propaganda based on the rhetorical techniques used to influence readers. These methods, however, classify one span at a time, ignoring dep

propaganda classification miml learning roberta-based model hierarchical label dependencies

发现论文，激发创造

大型语言模型用于多标签宣传检测

本研究通过提出的五种模型集成方法，针对包含 21 种宣传技巧的多标签文本分类任务有效地识别互联网宣传。最终在 WANLP 2022 共享任务中获得 59.73% 的微型 F1 分数，并进一步提出了未来的研究方向。

Oct, 2022

SemEval-2020 任务 11 中的 BPGC：基于多粒度知识共享和语言特征的集成学习在新闻文章中探测宣传

SemEval 2020 Task-11 aims to design automated systems for news propaganda detection, consisting of two sub-tasks, utilizing contextual embeddings and an ensemble of BERT and logistic regression classifiers with linguistic features to identify propaganda techniques and classify propagandist statements respectively.

May, 2020

大型语言模型的宣传划分注释

使用大型语言模型（如 GPT-4）作为标注员，通过提供更多信息来改善注释一致性和性能，从而进行检测宣传性文本片段的研究。

Nov, 2023

Inno 在 SemEval-2020 任务 11 中：利用纯 Transformer 进行多类别宣传检测

本文提出了基于 Transformer 模型的优化学习方案，用于检测新闻文章中的宣传技术，并在验证集和测试集上展示了不低于 0.6 和 0.58 的总 F1 得分，以及每个类别上的非零 F1 得分。

Aug, 2020

SemEval-2020 任务 11：新闻文章中的宣传技术检测

本文介绍了 SemEval-2020 任务 11 的研究结果和主要发现，该任务主要是探测新闻文章中的宣传技术。该任务由两个子任务组成，分别是文本片段的位置识别和宣传技术的分类。该任务吸引了 250 个团队的参与，最优解为使用预训练转换器和合奏的方法。

Sep, 2020

IITD 在 WANLP 2022 共享任务中：用于宣传检测的多语言多粒度网络

使用 XLM-R 模型预测给定推文中每个宣传技术的概率，运用多粒度神经网络与 mBERT 编码器，基于大规模阿拉伯语数据集进行多标签分类及序列标注任务，该方法在 WANLP'2022 的两项子任务中获得第二名。

Oct, 2022

SemEval-2020 任务 11 上的 ApplicaAI: 关于 RoBERTa-CRF，Span CLS 以及自训练是否有帮助

本文介绍了一种基于 RoBERTa 的半监督学习方法，用于获胜的宣传技巧分类和第二名的宣传文本范围识别任务，并探讨了架构决策和训练方案的影响。

May, 2020

IITK 参与 SemEval-2024 任务 4: 模因中辨别说服技巧的分层嵌入

利用 Class Definition Prediction 和超边缘嵌入方法构建的集成模型，提高了迷因分类的准确性和全面性，实现了多语言感化技巧的检测任务。

Apr, 2024

YNU-HPCC 在 SemEval2020 任务 11 中：使用 LSTM 网络检测新闻文章中的宣传技术

这篇论文总结了我们对 SemEval-2020 任务 11 中新闻文章宣传检测技术的研究，我们使用 GloVe、BERT 和 LSTM 模型结构实现了此任务，并且在 SI 和 TC 子任务中取得了良好的结果，超越了官方基线方法的性能，与测试集的排名分别为第 17 和第 22 名，并比较了不同的深度学习模型结构在新闻宣传检测上的性能。

Aug, 2020

GPT-4 能否识别宣传报道？新闻文章中宣传内容的注解和检测

使用 GPT-4 大型语言模型对包含 6 种其他语言的传媒行文进行细粒度的宣传技术检测，结果显示该模型在不同语种的跨度检测任务中遇到困难，相比于用于宣传检测的不同分类层次的模型微调后，GPT-4 仍然远远落后。

Feb, 2024