PACO:行动、文化和压迫相关挑衅
在首次分析印度和巴基斯坦之间由 Twitter 上的偏极信息引起的紧张关系的工作中,揭示了印度统治党派(BJP)的政治家们更多地使用极化的标签和呼吁升级冲突。
May, 2020
该论文通过对使用 youtube 的消息发文的语料 (来自 392460 个用户的英文评论) 的分析,研究了 2019 年 2 月 14 日在克什米尔的普尔瓦马恐怖袭击事件。该文三个主要贡献是:首先,提出了结合语言聚类的文档语言识别技术,具有极少的人工注释要求,表明该方法在各种低资源语言数据集中均具有可行性和效用。第二,对亲和和亲战意图的时间趋势进行了分析。最后,在两个国家军事紧张局势加剧的背景下,提出了自动识别可以缓解不友好氛围的用户生成的网络内容的重要性。
Sep, 2019
本文研究表明,目前最先进的语境化语言模型 GPT-3 存在对穆斯林的暴力偏见,我们对此进行了多方面的探讨和量化,并提出对抗性文本提示来缓解这种偏见。
Jan, 2021
本文研究通过对印度政治讨论的 WhatsApp 公共群组进行大规模的研究并构建分类模型,Characterize 恐惧言论的数据集,发现恐惧言论可能会造成长久的影响,并且当前最先进的 NLP 模型无法很好地处理这个问题。此外,作者还使用新的方法对这些 WhatsApp 群组的用户进行调查,发现消费和分享恐惧言论的用户类型与其他的 toxic speech 不同,这提出了新的问题需要研究。
Feb, 2021
群体间互动与不同背景事件对宗教群体之间的分化产生复杂的效应,既可以降低分化也可以加剧分化,因此了解背景与情境对群体间互动所产生的影响对于理解宗教分化的动态及其重要作用具有重要意义。
Feb, 2024
该研究论文介绍了 HASOC 子轨道,旨在为英语、印地语和马拉地语开发基准数据集,以支持在线平台的内容审核。他们解释了两种分析方法,分别为二元分类和精细分类问题,并提供分类算法的性能结果。
Dec, 2021
本文介绍了在社交媒体中迅速增长的仇恨言论现象以及如何使用多语言算法进行检测,其中包括 Hindi、德语和英语等三种语言,使用的数据集是通过机器学习系统对 Twitter 进行分类得到的,并使用了变压器结构 BERT 进行实验。
Aug, 2021
本文介绍了我们在第一届孟加拉语语言处理研讨会的暴力煽动文本检测共享任务中的工作。针对社交媒体上的仇恨和暴力煽动性言论的传播加速,开发高效的机制来检测和遏制此类文本的传播至关重要。在资源匮乏的环境中,检测暴力煽动文本的问题更加严重,因为研究稀少且数据较少。共享任务提供的数据是孟加拉语文本,每个示例根据暴力煽动文本的类型被分类为三个类别之一。我们尝试评估了几个基于 BERT 的模型,然后使用模型集成作为我们的最终提交。我们的提交在最终排行榜上排名第 10,宏观 F1 得分为 0.737。
Nov, 2023
自动检测孟加拉文网络内容中的社群暴力特征的首个综合框架的数据统计和基准测试表明,除了非社群暴力类别外,宗教社群暴力在孟加拉文本中尤为普遍;此外,通过对最先进的孟加拉深度学习模型进行初步基准测试,我们证实了微调语言模型在识别暴力评论方面的有效性。
Apr, 2024
研究表明,GPT-3 模型在被问及穆斯林时生成暴力文本补全的倾向性比基督徒和印度教徒更强,但最近的两项预注册实验尝试均未能证明其存在严重的偏差,而更换为消除偏见和有毒输出的 Fine-tuned Instruct Series 版本的 GPT-3 模型中则表现出了最小的偏见。然而,使用与宗教相关的常见名称则显著增加了暴力文本补全,也暴露出更强的二阶偏见,而无论提示格式如何,宗教特定的暴力主题均包含高度冒犯性的观点。因此,我们需要对大型语言模型进行更多的去偏见工作,以消除高阶模式和联想。
Aug, 2022