如何有效地进行不同意:研究维基百科争论中使用的策略
研究建立在 WikiDisputes 的语料库上,使用特征和神经网络模型,预测带有争议的维基百科讨论页面是否会被调解员升级为调解。结果表明,利用能够捕捉对话过程中语言标记变化的特征,和考虑对话结构的神经网络模型能更准确地预测结果。
Jan, 2021
该研究对社交媒体上的有害言论进行了内容分析,发现人们在回应有害言论时采用了多种语言策略,其中声誉攻击是最常见的。该研究为表达反对意见提供了综合视角,并探讨了阻止冒犯性或有问题言论的基层努力。
May, 2024
本文研究了 Wikipedia 上的编辑战的动态特征,并基于以前建立的算法建立了争议性和和平性文章的样本,并分析了这些样本的时间特征。在短时间尺度上,我们证明了冲突和活动模式的突发性之间存在明显的对应关系,并且记忆效应在争议中起重要作用。在长时间尺度上,我们确定了文章整体行为的三种不同的发展模式。我们能够区分最终导致共识的情况和妥协难以实现的情况。最后,我们分析了讨论网络,并得出结论,编辑战主要由少数编辑人员进行。
Feb, 2012
社交媒体平台上存在大量的仇恨评论。我们提出了一种用于生成反驳仇恨评论的可控策略的方法,并通过特征控制响应生成,研究了鼓励长期解决方案的可行性。
Jan, 2024
本文研究对话结构与对话语料库的关系,从线上论坛中的拒绝性对话入手,探查线上对话中表达和推断拒绝的特征,通过实验发现基于理论预测的特征可以被用于无需先确定特定讨论主题的识别拒绝性对话,且精度可以提升至 66%。
Sep, 2017
本研究首次探索了 Jiu-Jitsu 论证在同行评审中的应用,并提出了以态度和主题为导向的反驳生成任务。通过丰富同行评审中的话语结构数据集,我们引入态度根源、态度主题和典型反驳,并采用强大的反驳生成策略进行了评估。
Nov, 2023
在线空间中的毒性问题是一个日益普遍且严重的问题,因此,过去十年的机器学习研究重点放在计算检测和缓解在线毒性上。然而,由于历史上此类标注往往存在较低的一致性,最近的研究指出了在构建和利用这些数据集时考虑这一任务的主观性的重要性,并激发了对评定者不一致性进行分析和更好理解以及如何将其有效纳入机器学习开发流程的研究。虽然这些努力填补了重要的空白,但缺乏更广泛的评定者不一致性根本原因的框架,因此我们将这项工作置于更广泛的背景之上。在这篇综述论文中,我们分析了关于在线毒性评定者不一致性原因的大量文献,并提出了详细的分类法。此外,我们还总结和讨论了针对每个不一致性原因的潜在解决方案,并讨论了几个能促进未来在线毒性研究发展的开放问题。
Nov, 2023
本研究通过引入来自 Twitter 和 YouTube 的新数据集,揭示了 whataboutism、宣传和‘Tu quoque' 谬误之间的重叠和区别,并运用语义学的最新研究成果将 'what about' 词汇构造与 whataboutism 区分开来。我们的实验使用关注度权重进行负样本挖掘,取得了显著的进展,在 Twitter 和 YouTube 收集的数据中分别比最新技术方法提高了 4% 和 10%。
Feb, 2024
本研究探讨自然语言推理中的不一致性注释是如何产生的,并识别了 10 种引起不一致的原因,其中某些不一致是由于句子意义的不确定性,而另一些则是由于注释者偏见和任务工件的存在。我们通过两种建模方法来检测存在潜在分歧的文本项目:一个比标准 NLI 标签多一个 “复杂” 标签的四分类方法,和一个多标签分类方法。我们发现多标签分类方法更具表现力,并对数据的可能解释提供了更好的召回率。
Sep, 2022