Jan, 2024

X Hacking: 误导的自动机器学习的威胁

TL;DR通过介绍 X-hacking 的概念,本文展示了如何使用自动化的机器学习管道来搜索出产生期望解释并保持优越预测性能的 “可辩护” 模型,并将解释和准确性之间的权衡形式化为一个多目标优化问题。在熟悉的真实世界数据集上经验性地说明了 X-hacking 的可行性和严重性。最后,提出了可能的检测和预防方法,并讨论了 XAI 研究的可信度和可复制性的伦理意义。