Dec, 2023

通过聚类影响嵌入发现错误

TL;DR我们提出了一种识别测试例组的方法 —— 切片发现。我们将一致性定义为切片发现方法应该满足的一个关键属性,即同一切片内的错误预测应该有相同的原因。然后我们使用影响函数来推导一种新的切片发现方法 InfEmbed,它通过返回示例受相似训练数据影响的切片来满足一致性。InfEmbed 简单易用,通过将 K-Means 聚类应用于我们称为影响嵌入的新型表示方法。我们在两个基准测试中展示了 InfEmbed 的优越性,并且通过几个案例研究证明了其在模型调试中的有效性。