Jun, 2024

重新思考外部分布检测的评估:索利斯悖论

TL;DR本研究构建了一个名为 Incremental Shift OOD(IS-OOD)的基准,通过基于提出的语言对齐图像特征分解(LAID)的移位测量方法,将测试样本分成不同的子集,相对于 ID 数据集具有不同的语义和协变量移位程度,以解决当前存在的超出分布(OOD)检测基准中的 Sorites 悖论问题。此外,还构建了包含更多多样的协变量内容的高质量生成图像的 Synthetic Incremental Shift(Syn-IS)数据集,以补充 IS-OOD 基准。研究评估了在本基准上进行的当前 OOD 检测方法,并发现几个重要结论:(1)大多数 OOD 检测方法的性能随着语义移位的增加而显著提高;(2)某些方法如 GradNorm 在做出决策时较少依赖于语义移位,可能具有不同的 OOD 检测机制;(3)图像中过度的协变量移位也可能被某些方法视为 OOD。