话题酝酿中！从讨论特征提前预测争议性帖子

ACLApr, 2019

话题酝酿中！从讨论特征提前预测争议性帖子

Something's Brewing! Early Prediction of Controversy-causing Posts from Discussion Features

Jack Hessel, Lillian Lee

TL;DR使用 Reddit 社群内数据分析，探讨了有争议的帖子的特征和预测算法，并发现集中在初期评论文本和文本结构的讨论特征在预测能力上有显著贡献，特别是在社群转换的情况下。

Abstract

Controversial posts are those that split the preferences of a community, receiving both significant positive and significant negative feedback. Our inclusion of the word "community" here is deliberate: what is co

controversy community data analysis discussion features domain transfer

发现论文，激发创造

愤怒引发争议：分析 Reddit 上的争议和情绪

研究了 Reddit 上的争议性话题以及它们的情感动态，并发现争议性评论表达的愤怒情绪更高，乐观和正面情绪更少；争议性评论会对讨论中后续评论的情感产生影响，通常会导致愤怒情绪的长期增加以及积极情绪的减少，但具体情感变化的幅度和方向取决于讨论主题；情感能够更好地预测哪些评论会变得有争议，从而帮助社区更好地管理讨论。

Dec, 2022

ControversialQA：探究问题回答中的争议

本文介绍了第一个根据用户感知来定义争议性内容的问答数据集，并发现争议检测在问答过程中是必要且具有挑战性的，而争议与情感任务之间没有强关联。

Feb, 2023

社交媒体中的争议量化

本文通过社交媒体的内容和网络结构，采用基于图的三阶段管道方法对争议进行量化分析，比较了不同的争议度量方法，图构建方法和数据来源，并证明其新的基于随机游走的度量方法优于现有度量方法。

Jul, 2015

识别驱动在线讨论的社会信号：Reddit 社区案例研究

该研究聚焦于 Reddit 上的在线讨论，通过对不同社区的评论进行大量情感、相关性和内容分析，揭示了不同社区内高得分帖子的特征，进而探究社区话题的特异性、受众与管理水平对社区讨论的影响。

May, 2017

异见相左：在线对话中建设性异议的研究

研究建立在 WikiDisputes 的语料库上，使用特征和神经网络模型，预测带有争议的维基百科讨论页面是否会被调解员升级为调解。结果表明，利用能够捕捉对话过程中语言标记变化的特征，和考虑对话结构的神经网络模型能更准确地预测结果。

Jan, 2021

使用图形转换网络和社交上下文预测 Reddit 上的仇恨性讨论

本研究提出了一种系统来预测社交媒体平台上有害讨论，该解决方案使用上下文深度语言模型，并提出将最先发帖后的所有对话分析整合到最先发帖中，同时支持适应未来评论的分析。此外，将探讨针对特定社区的仇恨言论的分析是否会导致更有效的检测。我们从各种社区的 333,487 个 Reddit 讨论评估了我们的方法，发现社区特定建模将性能提高了两倍，并且捕捉更广泛的讨论背景的模型相对于有限背景的模型精度提高了 28％（最仇恨的内容提高了 35％）

Jan, 2023

网络上的社群互动与冲突

本研究考察了网站 Reddit 上 36,000 个社区之间的互动和如何导致冲突和负面互动。研究者发现少数社区 (小于 1%) 导致了 74% 的冲突，而冲突往往由高活跃度的社区成员开始，但由低活跃度的成员执行。冲突导致了 “回声室” 的形成，也对目标社区用户的整体活跃产生了负面影响。分析用户互动数据还提出了缓解冲突负面影响的策略，以及如何通过使用结合图嵌入，用户，社区和文本特征的 LSTM 模型来预测冲突的发生，早期预警系统可以防止冲突的发生。

Mar, 2018

对话线程的特征描述和整理：包括扩展、关注点、数量、重回

本文研究了论坛讨论中的两个关键子问题：评论数量预测和再次参与预测，并针对这两个问题提出了一些基于学习的方法并进行了评估。

Apr, 2013

基于主题模式的争议识别方法

本研究研究 Social Media 中的争议话题，提出了一种通过利用网络模式检测 Social Media 中争议话题的方法，该方法基于用户交互的局部模式，不需要了解自然语言，95% 的准确度比传统的句子分析方法和传播模型方法都有很大的改进。

Mar, 2017

新闻室的混合式调节：为内容调节员推荐精选文章

本文提出一种基于分类概率排名的推荐系统，能够结合用户和文本内容的特征，帮助和支持在线新闻机构评论区的内容管理者在选择精选评论时进行决策。通过使用文本特征和用户内容特征，该系统在测试集上获得了 F1-score 为 0.44 的最佳分类，同时在一组大型验证文章上获得了 NDCG@5 均值的最优值为 0.87，最后，根据内容管理者的专业评估，该系统在精选评论上得分为 0.83，并得出结论：添加文本特征可获得最佳得分，尽管精选评论仍然有些主观性，但该系统的推荐评论仍然很适合大多数内容管理者。

Jul, 2023