May, 2023

BiasAsker:测量会话型人工智能系统的偏见

TL;DR提出自动化框架 BiasAsker,通过构建包含 841 个社会群体和 8110 个有偏见属性的、综合性的社会偏见数据集,使用存在性测量的新方法,识别并衡量对话 AI 系统中的绝对偏见和相关偏见,对 8 个商业系统和 ChatGPT、GPT-3 等两个著名的研究模型进行广泛实验,结果表明,BiasAsker 生成的 32.83%的问题可以触发这些广泛部署的对话系统中的有偏见行为。