May, 2024
基于 Transformer 的大型语言模型检测反犹太主义仇恨言论
Detecting Anti-Semitic Hate Speech using Transformer-based Large Language Models
Dengyi Liu, Minghao Wang, Andrew G. Catlin
TL;DR我们研究了替代性的基于变压器的生成型 AI 技术,并开发了一种新的数据标注技术,证明了这些先进方法在应对仇恨言论检测中的比较有效性,强调在敏感环境中需要负责任和谨慎管理的 AI 应用。