该文提出了一个新颖的算法,用于构建自然参数的置信区间和p值,并使用高维线性回归问题和一个高通量基因组数据集进行测试。
Jun, 2013
本研究提出了一种在高维线性模型中测试线性假设的方法,可以不对模型的大小(即模型的稀疏性或表示假设的加载向量)进行任何限制,并通过测试与新设计的重组回归模型相关的时刻条件来实现。
Oct, 2016
本文提出了一种建立在鲁棒性预测推断上的不确定性估计模型,使用 conformal inference 方法建立了准确覆盖测试数据分布的预测集,通过估计数据漂移量建立了鲁棒性,并在多个基准数据集上进行了实验证明了该方法的重要性。
Aug, 2020
本文探讨了线性模型在实际数据中的泛化能力,并提出了一种在非独立同分布数据和分布变化情况下的解决方法,得到了渐近精确的理论结果,并在实际数据验证了结果的有效性。
May, 2023
提出了一种通过引入置信度修正的变化来减少交叉验证过程中的过度期望风险, 及从混合整数规划中获得可计算的放松, 从而最小化leave-one-out误差的方法, 能够比现有方法更快地得到更少误差的结果。
Jun, 2023
该论文介绍了一个重新采样框架,用于构建精确、无分布偏差且非渐近保证的真实回归函数置信区间,以适应用户选择的信赖水平,并提出了具体算法以演示该框架。通过数值实验验证了算法,并将其与近似渐近保证的置信椭球进行比较。
Aug, 2023
我们提出了一种新的鲁棒回归的表述,通过整合不确定性集的所有实现并采用平均方法来获得普通最小二乘回归问题的最优解。我们证明了这个表述意外地恢复了岭回归,并在现有回归问题的鲁棒优化和均方误差方法之间建立了缺失的联系。我们首先证明了四种不确定性集的等价性:椭圆、盒子、钻石和预算,并提供了惩罚项的闭式表达方式,其是样本大小、特征大小以及扰动保护强度的函数。然后我们展示了在具有不同扰动水平的合成数据集中,平均表述比现有最坏情况表述在样本外性能上的一致改进。重要的是,随着扰动水平的增加,改进也增加,这证实了我们方法在高噪声环境中的优势。我们对从UCI数据集获得的真实回归问题的样本外数据集中报告了类似的改进。
Nov, 2023
从条件概率估计(概率预测)生成信心区预测的简单技术用于标准机器学习算法在15个多类数据集上的测试,结果显示约44%的实验展示了良好校准的信心区预测,其中最近邻算法在所有数据上表现出色,这证明了有效信心区预测在医学诊断方面的实际益处。
May, 2024
利用一种名为CCR的新方法,通过使用模型输出的一系列符合预测间隔来建立模型参数的置信区间,创新地解决了模型参数置信区间构建中的挑战,并在有限样本情景下提供了覆盖保证。
我们通过估计有限维度数据的偏差项的均值和方差,利用高维集中现象,从而得到非渐近置信区间,从而纠正了一类大范围预测器的置信区间,扩展至稀疏回归和数据驱动预测器如神经网络,提高了基于模型的深度学习的可靠性。
Jul, 2024