CVPRJun, 2023

评估 ODD 性能的超出 AUROC 等指标

TL;DR岂止是用二分类任务来衡量 out-of-distribution detection 的性能,并且几乎没有考虑到检测阈值的影响,因此我们提出了一个新的评价指标 ——Threshold Curve 下的面积(AUTC),来惩罚 ID 和 OOD 之间差异性不足的情况。