本研究证明在逻辑回归模型中,当样本量和自变量个数的比例变大时,MLE 的偏差和方差均远大于经典预测所得,常用的 LRT 也未能满足卡方分布,因此现有的软件包所得出的推论是不可靠的。
Mar, 2018
研究在差分隐私条件下,如何通过相应的随机化测试方法区分分布 P 和分布 Q,以及有哪些测试方法对应最佳的样本复杂度,进而将这一结果应用于私有变点检测中,同时还讨论了算法稳定性对于检验假设的适用性及普适性。
Nov, 2018
研究了一种概率模型用于多种疾病的诊断,通过 quick score 算法可以计算出每种疾病的后验概率,并在 Quick Medical Reference(QMR)上得到了应用和性能结果。
Mar, 2013
通过在非层次逻辑回归模型系数上独立使用学生 - t 先前分布构造一个新的先前分布,具有更好的性能,并且自动应用更多的收缩到高阶交互项和自动生成更好的结果。
Jan, 2009
本文针对 Bayesian 统计推断中模型拟合的评估方法,提出了一种新思路,即把边缘似然与采用信息熵对数作为评分规则的对于所有大小为 p 的测试数据集迭代得出的穷举式的 leave-p-out 交叉验证等效形式,并探讨了边缘似然对先验选择敏感性的问题。同时,作者提出了累积交叉验证的替代方案。
May, 2019
本文利用近似消息传递理论、非渐近随机矩阵理论和凸几何技术等方法,证明了当变量数量 $p$ 远大于样本量 $n$ 时,逻辑回归模型的似然比检验不再服从卡方分布的事实,并探讨了相应的解决方案。
Jun, 2017
研究估计大量相互独立测试的零假设中的错误假设数量的问题,提出了一族方法来建立这种比例的下限置信区间,主要依据是测试的 p 值。这项工作的动机是在天文学中发生的一种信号检测问题。
Jan, 2005
在血清学中,我们提出了一种用于分类样本和估计未知维度中流行率的技术,通过将数据嵌入参数化的曲线空间,并通过最小化纯训练数据的经验分类误差来优化空间。
Aug, 2023
本文介绍了在高能物理中进行新现象发现和模型参数置信区间的基于似然的统计检验方法,聚焦于测试程序的性质,包括系统误差的考虑,推导了 Wilks 和 Wald 结果的渐近分布的显式公式,提出并证明使用代表性数据集 Asimov 数据集的方法,该数据集提供了一种在搜索或测量中获得中位实验灵敏度以及这一期望的波动的简单方法。
Jul, 2010
基于逻辑回归的比例估计方法作为参数统计推断的替代方法,以更丰富的总结统计信息来消除假设先验和卡方问题。
Nov, 2016