Jun, 2024

Demarked: 指责言论增强审查的策略:对抗言论、解毒及信息管理

TL;DR我们提出了一种综合方法,称为划界评分虐待性言论,基于四个方面--(i)严重程度评分;(ii)目标的存在;(iii)上下文评分;(iv)法律评分-- 并提出了更多的行动选择,如解毒、对抗性言论生成、阻止或最后手段人为干预。通过对不同司法管辖区、平台和研究论文中虐待性言论法规的彻底分析,我们强调了在预防措施中的差距,并提倡针对其多方面表现采取量身定制的主动措施。我们的工作旨在为有效应对在线虐待性言论的未来策略提供信息。