Apr, 2023

ChatGPT:在社交媒体中检测和区分令人讨厌、攻击性和有毒评论的承诺

TL;DR研究使用 ChatGPT 与 MTurker 注释进行 HOT 分类, 结果显示 ChatGPT 的准确率约为 80%,且分类方式比人工注释更一致,但其对 “毒性” 的分类大于对 “仇恨” 和 “冒犯” 的分类。研究结果对于使用生成式 AI 模型监管社交媒体上的大量用户生成内容具有重要意义。