Jun, 2021
黑盒概念学习模型的优势和风险
Promises and Pitfalls of Black-Box Concept Learning Models
Anita Mahinpei, Justin Clark, Isaac Lage, Finale Doshi-Velez, Weiwei Pan
TL;DR介绍了一种中间嵌入概念学习的机器学习模型,其预测性能可以和黑盒预测模型相媲美,但是这些模型学习到的概念表示却可能包含超越预定义概念所能描述的信息,进而导致预测解释存在误导性,研究探讨了信息泄漏的机理,并建议了有效的应对方法。