Mar, 2024

SCOD: 从启发式到理论

TL;DR在存在外部样本时面临选择性分类问题的可靠预测模型的设计,我们提出了三个关键贡献。首先,我们证明最优的 SCOD 策略采用了贝叶斯分类器用于分布内数据和一个在二维空间表示为随机线性分类器的选择器,利用了分布内分类器的条件风险和分布内外数据的似然比作为输入,与当前的分布外检测方法和专门针对 SCOD 开发的 Softmax 信息保留组合(SIRC)方法的次优策略不同。其次,我们证明在一个无分布设置下,只依赖分布内数据样本时 SCOD 问题无法以近似正确学习。第三,我们引入了 POSCOD,一种简单的方法,从分布内数据样本和无标签的分布内外数据混合中学习最优 SCOD 策略的插件估计。我们的实证结果验证了理论发现,并证明我们提出的方法 POSCOD 在有效解决 SCOD 问题上优于现有的分布外方法。