ICLRFeb, 2022

深度网络的性能太好以至于不可信吗?一个直接估计二元分类贝叶斯误差的方法

TL;DR本研究提出了一种简单直接的贝叶斯误差估计方法,可用于评估分类器和检测测试集过拟合。我们的方法灵活且无模型和实例需求,甚至适用于弱监督数据。实验结果表明,最近提出的深度网络,如 Vision Transformer 等,已经或即将达到基准数据集的贝叶斯误差。最后,我们还讨论了如何通过估计 ICLR 论文的贝叶斯误差来研究科学文章的接受 / 拒绝决策的困难程度。