May, 2024

基于 Transformer 的大型语言模型检测反犹太主义仇恨言论

TL;DR我们研究了替代性的基于变压器的生成型 AI 技术,并开发了一种新的数据标注技术,证明了这些先进方法在应对仇恨言论检测中的比较有效性,强调在敏感环境中需要负责任和谨慎管理的 AI 应用。