话题酝酿中!从讨论特征提前预测争议性帖子
研究了 Reddit 上的争议性话题以及它们的情感动态,并发现争议性评论表达的愤怒情绪更高,乐观和正面情绪更少;争议性评论会对讨论中后续评论的情感产生影响,通常会导致愤怒情绪的长期增加以及积极情绪的减少,但具体情感变化的幅度和方向取决于讨论主题;情感能够更好地预测哪些评论会变得有争议,从而帮助社区更好地管理讨论。
Dec, 2022
本文介绍了第一个根据用户感知来定义争议性内容的问答数据集,并发现争议检测在问答过程中是必要且具有挑战性的,而争议与情感任务之间没有强关联。
Feb, 2023
本文通过社交媒体的内容和网络结构,采用基于图的三阶段管道方法对争议进行量化分析,比较了不同的争议度量方法,图构建方法和数据来源,并证明其新的基于随机游走的度量方法优于现有度量方法。
Jul, 2015
该研究聚焦于 Reddit 上的在线讨论,通过对不同社区的评论进行大量情感、相关性和内容分析,揭示了不同社区内高得分帖子的特征,进而探究社区话题的特异性、受众与管理水平对社区讨论的影响。
May, 2017
研究建立在 WikiDisputes 的语料库上,使用特征和神经网络模型,预测带有争议的维基百科讨论页面是否会被调解员升级为调解。结果表明,利用能够捕捉对话过程中语言标记变化的特征,和考虑对话结构的神经网络模型能更准确地预测结果。
Jan, 2021
本研究提出了一种系统来预测社交媒体平台上有害讨论,该解决方案使用上下文深度语言模型,并提出将最先发帖后的所有对话分析整合到最先发帖中,同时支持适应未来评论的分析。此外,将探讨针对特定社区的仇恨言论的分析是否会导致更有效的检测。我们从各种社区的 333,487 个 Reddit 讨论评估了我们的方法,发现社区特定建模将性能提高了两倍,并且捕捉更广泛的讨论背景的模型相对于有限背景的模型精度提高了 28%(最仇恨的内容提高了 35%)
Jan, 2023
本研究考察了网站 Reddit 上 36,000 个社区之间的互动和如何导致冲突和负面互动。研究者发现少数社区 (小于 1%) 导致了 74% 的冲突,而冲突往往由高活跃度的社区成员开始,但由低活跃度的成员执行。冲突导致了 “回声室” 的形成,也对目标社区用户的整体活跃产生了负面影响。分析用户互动数据还提出了缓解冲突负面影响的策略,以及如何通过使用结合图嵌入,用户,社区和文本特征的 LSTM 模型来预测冲突的发生,早期预警系统可以防止冲突的发生。
Mar, 2018
本研究研究 Social Media 中的争议话题,提出了一种通过利用网络模式检测 Social Media 中争议话题的方法,该方法基于用户交互的局部模式,不需要了解自然语言,95% 的准确度比传统的句子分析方法和传播模型方法都有很大的改进。
Mar, 2017
本文提出一种基于分类概率排名的推荐系统,能够结合用户和文本内容的特征,帮助和支持在线新闻机构评论区的内容管理者在选择精选评论时进行决策。通过使用文本特征和用户内容特征,该系统在测试集上获得了 F1-score 为 0.44 的最佳分类,同时在一组大型验证文章上获得了 NDCG@5 均值的最优值为 0.87,最后,根据内容管理者的专业评估,该系统在精选评论上得分为 0.83,并得出结论:添加文本特征可获得最佳得分,尽管精选评论仍然有些主观性,但该系统的推荐评论仍然很适合大多数内容管理者。
Jul, 2023