在这项研究中,我们通过实验分析了当前的定量化算法在不同类型的数据集偏移下的行为,以识别现有方法的局限性,并为开发更广泛适用的方法铺平道路。我们通过提出细粒度的数据集偏移类型分类,建立受这些偏移类型影响的数据集生成协议,并在生成的数据集上测试现有的定量化方法。研究结果表明,许多已被发现对于先验概率偏移具有鲁棒性的定量化方法对于其他类型的数据集偏移可能不具备鲁棒性。此外,没有发现任何现有的定量化方法能够对我们在实验中模拟的所有数据集偏移类型具备足够的鲁棒性。
Oct, 2023
本研究旨在探讨采用结构化预测的有监督学习模型解决量化问题,通过在 5500 个二进制高维数据集上实验,证明该方法比现有的量化方法更准确、更稳定、更高效。
Feb, 2015
提出了无界和有界的调整方法,以平均预测与类分布相等化,以最小化得分规则。实验结果表明在实际应用中,即使类分布仅近似已知,仍然可以根据移位量和类分布的精度减少损失。
Nov, 2021
本研究讨论了在不同分布的训练数据中,选择一个平衡偏差和方差的适当子树的剪枝问题,并提出了首个在这种情况下进行最优剪枝的高效程序。
May, 2023
本研究提出了用于优化量化特定的性能参数的首批在线随机算法,其对于多变量优化的理论具有最优的收敛性,并通过实验验证,相对于现有的算法,能够更好地对性能参数进行优化。
May, 2016
本文提出了一种基于约束学习的新框架, 可以通过在训练数据的子集上预测正 / 负例率来解决二分类器中的类不平衡问题,并避免了复杂的约束优化问题。该方法与模型无关且仅支出少量计算代价。在各种基准测试上的实验显示了与现有基准相比具有具有竞争性的性能。
Feb, 2018
训练模型以适应由类先验或群组先验的分布变化引起的偏移问题并不容易,我们提出一种极其轻量级的事后方法,通过在验证集上求解约束优化问题并应用于模型,从而在测试时尽量减小选定目标分布周围的分布鲁棒性损失,并带有可证明的保证和实证的结果证明,表明我们的方法非常适用于分布鲁棒的事后分类器。
Sep, 2023
模型得分和不确定性对决策边界的选择有关,该研究提供了理论分析和经验证据来证明模型得分估计偏差依赖于不确定性和得分本身,通过动态规划和保序回归算法提出的方案在三个真实数据集上比传统的只使用模型得分方法,在高精确度边界下获得了 25%-40%的召回率提升,凸显了利用不确定性的好处。
Nov, 2023
本研究通过建立不等式来描述近似的 pinball 风险最小化器与相应条件分位数之间的接近程度,再利用这些不等式建立了所谓的方差界,并利用两种类型的不等式来证明使用 pinball 损失函数的支持向量机的 Oracle 不等式,从而实现了最小 - 最大下限对某些标准规定的条件分位数的正则性假设。
Feb, 2011
本文提出了新的分位数方法,可以适用于任何回归模型,并允许在校准和锐度之间进行权衡,优化中心区间的校准度,并产生更准确的条件分位数。
Nov, 2020