- 社交媒体上的毒性定义和检测:关键在于上下文和知识
本研究旨在通过使用心理学和社会理论来定义网络上的毒性,提出了一种多维度的网络毒性检测方法,结合显式知识和统计学习算法,以解决网络毒性检测中的歧义和复杂度问题。
- 在线虐待内容检测中的道德设计
该研究在 NLP 领域探讨了如何构建一个统一的框架,用于解决识别恶意内容(包括仇恨言论,毒性评论,网络欺凌等)的问题,并强调了伦理问题的重要性。提出了一个基于 “设计伦理” 的新框架,通过两个步骤来区分个人信息相对的非个人信息、在每个类别中 - EMNLP跨语言嵌入的多语言攻击性语言识别
本文探讨了如何利用跨语境上下文词向量和迁移学习在使用资源较少的本地化语言中进行社交媒体中的冒犯内容检测,结果表明这个方法在孟加拉语、印地语和西班牙语等多种语言中的检测效率较高。
- EMNLPHENIN: 在社交媒体上学习异质神经相互作用网络用于可解释的网络欺凌检测
提出了一种深度学习模型 HEterogeneous Neural Interaction Networks (HENIN),用于社交媒体中的可解释网络欺凌检测,其包含评论编码器、帖子 - 评论共注意力子网络以及会话 - 会话以及帖子 - 帖 - 带公平性约束的网络欺凌检测
本研究提出了一种采用公正性约束的模型训练方案,旨在缓解网络暴力检测模型中的意外偏见,证明了各种类型的意外偏见可以成功地减轻而不损害模型的质量。
- SOLID: 一个大规模半监督的辱骂语言识别数据集
本论文扩展了 OLID 数据集,提出了一个新的名为 SOLID 的数据集,其中包含九百多万英语推文,标记为准半监督方式,使用 SOLID 和 OLID 组合可以获得相当大的性能提升,尤其是在分类学的较低层面。
- AAAI针对网络欺凌分类的细化表征:侵略性、重复性、有意性、可见性和不平衡性
研究了在线社区中的网络欺凌及其识别方法,并通过构建基于社交网络和语言特征的分类器来提高分类性能。
- 希腊语中的攻击性语言识别
该研究针对互联网社区和社交媒体平台中的恶意内容问题,在英语研究有限的情况下,通过希腊注释数据集 OGTD,评估了几个计算模型,以便识别 Twitter 上的带攻击性的帖子和不带攻击性的帖子。
- 基于机器学习和语义分析的网络游戏聊天室霸凌检测
本文介绍了一种自动数据收集系统,用于从在线多人游戏《坦克世界》中连续收集游戏聊天数据,并结合在线数据服务的其他信息。并提出了一种评分方案,用于基于当前研究的网络欺凌识别。该研究使用简单的特征检测,通过 SQL 数据库查询对收集的数据进行了分 - 在社交媒体中检测网络欺凌和网络攻击
本研究使用机器学习算法对 Twitter 上的滥用行为进行分类,包括网络欺凌和侵略行为,并通过分析用户、网络和文本属性的差异识别出欺负和侵略者。结果表明,该算法能够以超过 90%的准确率和 AUC 分类这些账户。同时,探讨了 Twitter - 利用基于深度学习的模型在社交网络中检测网络欺凌的可复现性研究
本文调查了最近关于 Cyberbullying 检测方面的文献研究结果。通过使用与文献作者相同的数据集,我们成功再现了他们的结果,并在 YouTube 数据集上进行了扩展研究,研究表明基于深度学习的模型优于先前应用于同一 YouTube 数 - 利用语言和社交特征预测 Instagram 上敌对言论的存在和强度
本论文旨在利用语言和社交特征预测未来在线讨论中针对性评论的出现和强度,并基于 Instagram 评论数据集,展示其在预测任务完成中的良好表现。
- 印度英语混合编码数据的攻击注释语料库
为了防止网络暴力和仇恨言论,本文通过对两个印度最流行的社交媒体平台 Twitter 和 Facebook 上的印地语 - 英语代码混合数据进行注释,开发出一套攻击标签集和注释语料库,以进行进一步的研究和防范。
- 跨多个社交网络平台检测网络欺凌的深度学习
本研究采用深度学习模型和迁移学习方法,对包括 Formspring、Twitter 和 Wikipedia 等多个社交媒体平台的数十万条帖子进行了系统分析,并成功地解决了仅针对单一平台、仅针对特定主题和基于手工特征等问题,为针对多个主题的网 - 社交媒体文本的网络欺凌自动检测
本研究旨在探讨使用线性支持向量机通过模拟欺凌者、受害者和旁观者的帖子,实现自动检测社交媒体文本中的网络欺凌,并收集并德细注释英语和荷兰语的训练语料库。我们利用丰富的特征集进行一系列二元分类实验,研究哪些信息源对于这一特定任务最有贡献,同时对 - 理解虐待:虐待语言检测子任务的分类
本文讨论了关于虐待性语言检测和分析的不同子任务之间的关系,并提出了一个能够捕捉它们之间相似性和差异性的类型学,强调了研究者可以采取的最佳方法来处理他们感兴趣的虐待性语言检测子任务。
- WWW测量 #GamerGate:仇恨、性别歧视和欺凌的故事
本文研究了 2014 年网游世界的 Gamergate 争端,通过对 Twitter 用户发布的数据进行测量,发现参与这一 “Twitter 之战” 的用户往往拥有更多的朋友和关注者,发布具有负面情绪和仇恨的推文,并探讨了 Twitter - 探测推特上的攻击和欺负行为: Mean Birds
该论文通过对推特用户的文本、用户和网络属性的提取和分析,提出了一种有效的、可扩展的方法来检测网络欺凌和攻击行为,并通过机器学习分类算法,在 1.6M 条推文上取得了 90% 以上的准确率。
- ICML利用参与者词汇一致性进行网络欺凌识别
本文提出了一种基于社交互动以及欺凌指标种子词典的模型,通过参与者 - 词汇一致性构建目标函数,可以同时发现欺凌者和受害者以及新的欺凌词汇,并通过 Twitter 和 Ask.fm 数据集展示了该方法的有效性。
- 探索在线团队竞技中的网络欺凌和其他有害行为
本研究旨在探索在线团队竞技游戏中的网络欺凌和其他有害行为,使用超过 1000 万个玩家报告的数据集和相应的众包决策,对多个有关有害行为的理论进行了测试,此外,本研究还可为构建检测、预防和对抗有害行为的系统提供基础。