二元分类的回归函数的无分布推断
研究如何利用正向数据进行二分类器学习,提出了一种基于正向置信度的分类器,命名为正向置信度(Pconf)分类,提供了一个基于经验风险最小化的框架,理论上证明了其一致性和估计误差界,并通过实验表明了其对训练深度神经网络的有效性。
Oct, 2017
针对模型类如何拟合标记数据的问题,我们提出了一种计算学习能力的方法,可以使用较小的数据量得出精确结果。该方法也适用于二元分类问题,并在多种真实和合成数据集上得到了验证。
May, 2018
本文介绍一种基于分位数回归和树状结构分类器的符合性预测方法,可以有效解决多分类和多标签问题中难易样本分布不均匀、信心区间过大等挑战,且可以和任何分类模型结合使用并保证有效性。
Apr, 2020
研究数据无任何分布性假设条件下,针对二分类问题的不确定性量化中的三种方法——标定、置信区间和预测集,建立了连接这三个概念的三角脚架,明确了使用基于评分函数的分类器才能进行无分布标定的必要条件。我们还推导了面向固定宽度和统一质量分组的二分类问题中的无分布概率分组方法的置信区间,这些区间可以导致无分布标定。此外,我们还推导了针对流数据和协变量转移的扩展。
Jun, 2020
本文通过理论证明和实验证明,在可实现的二元分类问题下,当数据由逻辑模型生成且样本量远大于参数个数时,对数回归具有固有的过度自信及其原因。作者还证明,存在其它激活函数和合适的损失函数,使得学习的分类器在某些概率值附近表现不足。
Feb, 2021
介绍一种无需分布假设或模型假设,可用于任何预训练模型(如神经网络)生成100%正确性置信区间(信赖区间)的方法, 称之为一致预测;并提供了Python示例代码和Jupyter笔记本来说明此方法在计算机视觉、自然语言处理和深度强化学习等领域上的应用。
Jul, 2021
本文探讨了分布鲁棒的怀疑推断在多标签问题中的应用,特别是在Hamming损失方面,表明我们的方法可以在某些情况下提供有用的推断,并证明在处理不完整信息时比其它方法更优。
May, 2022
基于可靠性和可问责性的指导原则,本文提出了一种模型无关的统计框架,用于不确定性量化和统计推断,通过预测集提供可控制第一类错误的有限样本控制方法,并提供了灵活的工具用于不确定性概率推理。
Jul, 2023
使用任意预测模型构建置信区间,不依赖于噪音模型并可扩展至非严格线性函数,采用混合整数线性规划框架进行优化和参数坐标的置信区间提取,适用于假设检验,并通过合成数据验证了方法的实证适用性。
Jan, 2024
本文提出了一种用于估计贝叶斯分类器中的假阳性率的估计器,并对其进行了广泛的理论分析,包括一致性、无偏性、收敛速度和方差。此外,还通过利用去噪技术和Nadaraya-Watson估计器,开发了一种用于估计有噪声标签情况下的假阳性率的有效估计器。由于问题的对称性,我们的结果还能被直接应用于估计贝叶斯分类器的假阴性率。
Jan, 2024