Jan, 2020

在评估可解释 AI 系统时,代理任务和主观度量可能会误导

TL;DR本研究通过在线实验和现场思考研究评估了两种当前常用的XAI系统评估技术,并发现代理任务和主观度量在实际决策任务中均未能预测评估结果,这表明当前的评估方法可能错误地拖慢了我们开发可靠执行出色的人工智能与人类团队的进步。