非均匀大规模数据中的最大极小效应
考虑到基因组关联研究,在许多预测变量已经在同一个个体中收集并且每个预测变量都是单独分析的情况下,我们引入一个标准的线性模型,并在其中引入一个额外的随机效应。本文的三个创新点是(1)线性和 log-odds 尺度之间的转换是准确的,特别适用于小效应大小的重要的遗传情况;(2) 一种极大似然算法,比以前发表的方法快一个数量级以上;和 (3) 计算边缘似然的有效方法,允许贝叶斯模型比较。该方法已成功应用于包括超过 20,000 个人和 500,000 个遗传变异的多发性硬化的大规模关联研究。
Jul, 2012
本文旨在探测和估计治疗干预对感兴趣结果变量上的治疗效果,其中异质性治疗效应在个性化医学等实际应用中日益受到关注。我们将异质性治疗效应建模为两个基线函数之间的平滑非参数差异,并确定了非参数异质性治疗效应估计的紧密统计限制作为协变量几何函数的函数。特别地,一个两阶段最近邻估计器可以通过抛弃匹配质量差的观测值来接近极小值。我们还建立了密度比的紧密依赖性,而不需要通常的假设协变量密度远离零,在此关键步骤是采用独立于兴趣的新型极限不等式。
Feb, 2020
本研究证明在逻辑回归模型中,当样本量和自变量个数的比例变大时,MLE 的偏差和方差均远大于经典预测所得,常用的 LRT 也未能满足卡方分布,因此现有的软件包所得出的推论是不可靠的。
Mar, 2018
本文提出了一种评估应用计量经济学结论对样本中很小一部分数据敏感性的方法 —— 近似最大影响摄动法,并提供了有限的样本误差界,发现敏感性取决于推断问题中的信噪比,不会随着渐近逐渐消失,并不是由于错误规范而引起的。
Nov, 2020
通过最大线性模型的回归,我们对具有最大函数的组合线性模型进行了研究,这种模型在信号处理、统计学和其他多个领域中普遍存在,并且在相位恢复、学习整流线性单元激活函数等方面具有扩展性。我们提供了渐进收敛性分析,并证明了梯度下降和随机梯度下降在最大线性回归问题中的收敛性。数值结果验证了理论发现,尤其是在带有噪声的低样本情况下,随机梯度下降不仅在运行时间上收敛更快,而且性能优于交替最小化和梯度下降。
Aug, 2023
本文提出了一种可扩展的随机主化最小化方案,能够应对大规模或可能无限的数据集,解决凸优化问题,并开发了几种基于此框架的有效算法,包括一个新的随机近端梯度方法,用于大规模 l1 逻辑回归的非凸稀疏估计的在线 DC 编程算法和解决大规模结构矩阵分解问题的有效性。
Jun, 2013
研究对于在测试和训练分布不同时的结构因果模型中预测响应变量和协变量之间关系的问题,提出了基于因果回归模型和最小化最坏风险的方法,并且介绍了一个配合数据实现最小化风险的框架和方法 NILE。
Jun, 2020
本文提供了在高维情况下学习高斯混合物的准确最小值界限和基本限制,研究表明,如果存在决定均值分离的随机维度的稀疏子集,则样本复杂度只取决于相关维度的数量和平均分离,可通过简单的计算有效过程来实现;结果为最近结合特征选择和聚类的方法提供了理论基础的第一步。
Jun, 2013
本研究提出了一种针对高维线性混合效应模型的 $\ell_1$- 惩罚估计过程,该模型对于高维观测中存在分组结构的数据非常有用。我们证明了一致性和优化性结果,并开发了一种具有可证明数值收敛性的算法。此外,我们还在模拟和实际高维数据集上展示了该方法的性能。
Feb, 2010