PACO：行动、文化和压迫相关挑衅

Mar, 2023

PACO: Provocation Involving Action, Culture, and Oppression

Vaibhav Garg, Ganning Xu, Munindar P. Singh

TL;DR本研究旨在通过使用 PACO 数据集训练 fine-tuned RoBERTa 模型，自动识别 WhatsApp 帖子中的挑衅句子，以避免情绪化文字对目标宗教群体的歧视或暴力。研究还通过识别针对宗教群体使用的对话交际行为和不礼貌策略，从语用学角度研究挑衅性言论。

Abstract

In india, people identify with a particular group based on certain attributes such as religion. The same religious groups are often provoked against each other. Previous studies show the role of →

india religious groups provocation whatsapp automated identification

发现论文，激发创造

印度和巴基斯坦社交媒体极化的计算机分析

在首次分析印度和巴基斯坦之间由 Twitter 上的偏极信息引起的紧张关系的工作中，揭示了印度统治党派（BJP）的政治家们更多地使用极化的标签和呼吁升级冲突。

May, 2020

希望言论检测：和平之声的计算分析

该论文通过对使用 youtube 的消息发文的语料 (来自 392460 个用户的英文评论) 的分析，研究了 2019 年 2 月 14 日在克什米尔的普尔瓦马恐怖袭击事件。该文三个主要贡献是：首先，提出了结合语言聚类的文档语言识别技术，具有极少的人工注释要求，表明该方法在各种低资源语言数据集中均具有可行性和效用。第二，对亲和和亲战意图的时间趋势进行了分析。最后，在两个国家军事紧张局势加剧的背景下，提出了自动识别可以缓解不友好氛围的用户生成的网络内容的重要性。

Sep, 2019

大型语言模型中持续存在的反穆斯林偏见

本文研究表明，目前最先进的语境化语言模型 GPT-3 存在对穆斯林的暴力偏见，我们对此进行了多方面的探讨和量化，并提出对抗性文本提示来缓解这种偏见。

Jan, 2021

从恐惧到仇恨的道路很短：印度 WhatsApp 群中的恐惧言论

本文研究通过对印度政治讨论的 WhatsApp 公共群组进行大规模的研究并构建分类模型，Characterize 恐惧言论的数据集，发现恐惧言论可能会造成长久的影响，并且当前最先进的 NLP 模型无法很好地处理这个问题。此外，作者还使用新的方法对这些 WhatsApp 群组的用户进行调查，发现消费和分享恐惧言论的用户类型与其他的 toxic speech 不同，这提出了新的问题需要研究。

Feb, 2021

跨越或分裂：群体间互动对宗教极化的影响

群体间互动与不同背景事件对宗教群体之间的分化产生复杂的效应，既可以降低分化也可以加剧分化，因此了解背景与情境对群体间互动所产生的影响对于理解宗教分化的动态及其重要作用具有重要意义。

Feb, 2024

FIRE 2021 HASOC 子赛道概观：英语和印度－雅利安语言中的仇恨言论和攻击性内容识别

该研究论文介绍了 HASOC 子轨道，旨在为英语、印地语和马拉地语开发基准数据集，以支持在线平台的内容审核。他们解释了两种分析方法，分别为二元分类和精细分类问题，并提供分类算法的性能结果。

Dec, 2021

FIRE 2020 上 HASOC 赛道概述：印欧语系中的仇恨言论与攻击内容识别

本文介绍了在社交媒体中迅速增长的仇恨言论现象以及如何使用多语言算法进行检测，其中包括 Hindi、德语和英语等三种语言，使用的数据集是通过机器学习系统对 Twitter 进行分类得到的，并使用了变压器结构 BERT 进行实验。

Aug, 2021

Mavericks 在 BLP-2023 任务 1 中：使用语言模型的基于合集的方法进行暴力煽动文本检测

本文介绍了我们在第一届孟加拉语语言处理研讨会的暴力煽动文本检测共享任务中的工作。针对社交媒体上的仇恨和暴力煽动性言论的传播加速，开发高效的机制来检测和遏制此类文本的传播至关重要。在资源匮乏的环境中，检测暴力煽动文本的问题更加严重，因为研究稀少且数据较少。共享任务提供的数据是孟加拉语文本，每个示例根据暴力煽动文本的类型被分类为三个类别之一。我们尝试评估了几个基于 BERT 的模型，然后使用模型集成作为我们的最终提交。我们的提交在最终排行榜上排名第 10，宏观 F1 得分为 0.737。

Nov, 2023

暴力图谱：基于社交媒体互动构建孟加拉宗派表达数据集的广泛框架

自动检测孟加拉文网络内容中的社群暴力特征的首个综合框架的数据统计和基准测试表明，除了非社群暴力类别外，宗教社群暴力在孟加拉文本中尤为普遍；此外，通过对最先进的孟加拉深度学习模型进行初步基准测试，我们证实了微调语言模型在识别暴力评论方面的有效性。

Apr, 2024

去偏见的大规模语言模型仍将穆斯林与独特的暴力行为相关联

研究表明，GPT-3 模型在被问及穆斯林时生成暴力文本补全的倾向性比基督徒和印度教徒更强，但最近的两项预注册实验尝试均未能证明其存在严重的偏差，而更换为消除偏见和有毒输出的 Fine-tuned Instruct Series 版本的 GPT-3 模型中则表现出了最小的偏见。然而，使用与宗教相关的常见名称则显著增加了暴力文本补全，也暴露出更强的二阶偏见，而无论提示格式如何，宗教特定的暴力主题均包含高度冒犯性的观点。因此，我们需要对大型语言模型进行更多的去偏见工作，以消除高阶模式和联想。

Aug, 2022