Nov, 2023

评估对志愿内容管理员的支持,不仅仅是毒性检测

TL;DR自动内容审核方法、内容审核、有害、冒犯和志愿者审核人员是本文的关键词,研究提出了自动审核模型与志愿审核人员需求之间的差距,并测试了先进语言模型在平台规则违规检测上的表现。