Mar, 2024

可解释性布局对人类对冒犯性句子的感知是否有影响?

TL;DR本文通过用户研究评估三种机器学习 (Machine Learning) 可解释性布局对参与者评估包含仇恨言论的句子时的影响,重点关注 “厌女症” 和 “种族主义” 类别。通过问卷调查的统计和定性分析提供在线社区中使用机器学习可解释性的经验证据。统计分析结果显示,可解释性布局对参与者观点没有显著影响,但定性分析结果表明机器学习可解释性的优点:1) 在参与者观点和模型之间存在差异时,触发参与者提供纠正性反馈;2) 提供超越传统性能指标评估模型行为的见解。