Apr, 2023
ChatGPT:在社交媒体中检测和区分令人讨厌、攻击性和有毒评论的承诺
"HOT" ChatGPT: The promise of ChatGPT in detecting and discriminating hateful, offensive, and toxic comments on social media
Lingyao Li, Lizhou Fan, Shubham Atreja, Libby Hemphill
TL;DR研究使用 ChatGPT 与 MTurker 注释进行 HOT 分类, 结果显示 ChatGPT 的准确率约为 80%,且分类方式比人工注释更一致,但其对 “毒性” 的分类大于对 “仇恨” 和 “冒犯” 的分类。研究结果对于使用生成式 AI 模型监管社交媒体上的大量用户生成内容具有重要意义。