BriefGPT.xyz
Ask
alpha
关键词
fairness in content moderation
搜索结果 - 1
ACL
谁的偏好?公平偏好的差异及其对利用人类反馈的人工智能公平性的影响
通过从人类反馈中学习,我们考虑在内容审查中公平性的设置,在比较两个评论时,人类反馈被用来确定如何处理涉及不同敏感属性组的评论。我们发现,与注释者的种族、年龄、政治立场、教育水平和 LGBTQ + 身份有关,公平偏好存在显著差异,并且文本中提
→
PDF
a month ago
Prev
Next