Jun, 2024

评估模型在附近的普遍性

TL;DR该论文评估了分类模型在无需依赖于标签的情况下对于分布外测试集的泛化能力,并提出了一种名为 vicinal risk proxy (VRP) 的方法来计算模型的准确性,该方法通过综合考虑邻近样本的响应来评估每个样本的正确性,从而在方法学和实验上稳定地提高了现有泛化指标与模型准确性的相关性,特别是在具有挑战性的分布外测试集上。