Jun, 2022
在潜空间中提炼模型失败方向
Distilling Model Failures as Directions in Latent Space
Saachi Jain, Hannah Lawrence, Ankur Moitra, Aleksander Madry
TL;DR本文介绍了一种自动提取模型误差模式的方法:使用线性分类器来识别一致的错误模式,并将其表示为特征空间内的方向。使用此框架,结合扩散模型,能够自动发现训练数据集中具有挑战性的子人群,进而进行数据扩充,以改善模型失效的情况。