层次多实例多标签学习在检测宣传技术中的应用
本研究通过提出的五种模型集成方法,针对包含 21 种宣传技巧的多标签文本分类任务有效地识别互联网宣传。最终在 WANLP 2022 共享任务中获得 59.73% 的微型 F1 分数,并进一步提出了未来的研究方向。
Oct, 2022
SemEval 2020 Task-11 aims to design automated systems for news propaganda detection, consisting of two sub-tasks, utilizing contextual embeddings and an ensemble of BERT and logistic regression classifiers with linguistic features to identify propaganda techniques and classify propagandist statements respectively.
May, 2020
本文提出了基于 Transformer 模型的优化学习方案,用于检测新闻文章中的宣传技术,并在验证集和测试集上展示了不低于 0.6 和 0.58 的总 F1 得分,以及每个类别上的非零 F1 得分。
Aug, 2020
本文介绍了 SemEval-2020 任务 11 的研究结果和主要发现,该任务主要是探测新闻文章中的宣传技术。该任务由两个子任务组成,分别是文本片段的位置识别和宣传技术的分类。该任务吸引了 250 个团队的参与,最优解为使用预训练转换器和合奏的方法。
Sep, 2020
使用 XLM-R 模型预测给定推文中每个宣传技术的概率,运用多粒度神经网络与 mBERT 编码器,基于大规模阿拉伯语数据集进行多标签分类及序列标注任务,该方法在 WANLP'2022 的两项子任务中获得第二名。
Oct, 2022
本文介绍了一种基于 RoBERTa 的半监督学习方法,用于获胜的宣传技巧分类和第二名的宣传文本范围识别任务,并探讨了架构决策和训练方案的影响。
May, 2020
利用 Class Definition Prediction 和超边缘嵌入方法构建的集成模型,提高了迷因分类的准确性和全面性,实现了多语言感化技巧的检测任务。
Apr, 2024
这篇论文总结了我们对 SemEval-2020 任务 11 中新闻文章宣传检测技术的研究,我们使用 GloVe、BERT 和 LSTM 模型结构实现了此任务,并且在 SI 和 TC 子任务中取得了良好的结果,超越了官方基线方法的性能,与测试集的排名分别为第 17 和第 22 名,并比较了不同的深度学习模型结构在新闻宣传检测上的性能。
Aug, 2020
使用 GPT-4 大型语言模型对包含 6 种其他语言的传媒行文进行细粒度的宣传技术检测,结果显示该模型在不同语种的跨度检测任务中遇到困难,相比于用于宣传检测的不同分类层次的模型微调后,GPT-4 仍然远远落后。
Feb, 2024