hateful speech | BriefGPT - AI 论文速递

关键词hateful speech

搜索结果 - 4

利用人工智能打击网络仇恨：探索大型语言模型在仇恨言论检测中的挑战和机遇
我们的研究通过综述和实证分析，揭示大型语言模型在检测恶意言论中的能力和限制，强调它们作为分类器的角色以及发现优秀的模型和他们的特点和训练方法，为理解大型语言模型在关键的恶意言论检测领域的能力做出贡献。
PDF4 months ago
量化仇恨社群如何在线上激进化用户
本文以 Reddit 社区为例，测量加入具有仇恨言论的极端社区对该社交媒体平台中仇恨言论传播的影响，研究发现加入这种社区会导致恶意言论在平台上传播，并且这种负面影响会持续数月，为降低仇恨言论传播的风险，有必要对这些 “回音室” 进行管理。
PDF2 years ago
ACL2020 年美国选举中针对政治对手的仇恨：基于攻击性言论和立场检测的 Twitter 语料库研究
本研究分析 2020 年美国大选期间，支持者在社交媒体上对候选人的仇恨和冒犯性言论，建立了针对这些言论的标注任务，并采用 BERT 基线分类器评测了该任务的性能，从而为针对仇恨语言的计算模型提供了一种新的公开资源。
PDF3 years ago
网络仇恨：解决在线社交空间中的仇恨言论问题
该研究论文探讨在线社交平台上仇恨性言论的检测方法，指出基于关键词方法检测的不足，并提出利用自我定义仇恨社区产生的内容作为训练数据的方法，实现了良好的检测性能。
PDF7 years ago