- 关于预测强化引导的自助法注释
PPBoot is a bootstrap-based method that simplifies and expands the scope of prediction-powered inference to estimation p - 通用图和节点分类的编码器嵌入
将图编码嵌入方法扩展到包括加权图、距离矩阵和核矩阵等一般图模型,证明该方法满足大数定律和中心极限定理,能够在一定条件下实现渐近正态性,并通过一系列实验证实了这些理论发现。
- 自适应实验中的差分隐私 CATE 估计
该研究旨在研究上下文匹配实验中社会福利损失与统计功效之间的折中,并提出了一个多目标优化问题的上下界匹配方法,以及结合隐私保护措施的差分隐私算法,并推导出了估计器的渐近正态性质。
- 自适应线性模型的统计限制:低维估计与推断
使用自适应数据收集的估计和推断在统计学中面临重大挑战。通过研究单个坐标估计的错误表明了适应性数据和 i.i.d. 数据之间估计性能的显著差异。研究表明 OLS 方法可实现匹配的估计错误,我们还提出了一种新的单坐标推断估计器,通过解两阶段自适 - 反问题函数性质的源条件双稳健推断
估计线性反问题解的线性功能参数的研究,提供首个双重健壮推理方法以确保感兴趣的参数的渐近正态性,无需了解哪个反问题更合适,这一结果是迭代 Tikhonov 正则化对抗性估计器在线性反问题上的新担保为通用假设空间的发展创造的。
- 自适应线性估计方程
本文提出了一种构建无偏估计器的普遍方法,使用自适应线性估计方程的思想,并建立渐近正常性的理论保证,以及实现接近最优渐近方差的讨论。
- 平均加速随机梯度下降算法:有限样本速率和渐近正态性
本研究分析了随机梯度下降与动量法在强凸设置下的有限样本收敛速度,并证明了 Polyak-averaging 版本的 SGDM 估算器的渐近正态性以及其与平均 SGD 的渐近等价性。
- 随机中点采样法的遍历性,偏差和渐进正态性
本文针对强凸和光滑势能情况下的 Langevin 扩散,使用随机中点离散方法进行了分析,研究了其离散化的概率性质,包括其常数步长离散化获得的离散链的稳态分布以及其与目标分布之间的偏差,最终证明了随机中点离散方法具有渐近正常性和相对于其他离散 - 上下文匹配赌博机环境下的在线决策统计推断
这篇论文研究在线决策问题,通过采用上下文乐队 it,并建立奖励模型来进行长期奖励最大化。 使用估计模型参数的 OLS 和 WLS 方法来处理该问题,借助中心极限定理证明了参数的渐近正常性。同时,我们还通过实验验证了我们的结论。
- 非凸区域中恒定步长随机梯度下降的分析:渐近正态性和偏差
本研究探讨了非凸非光滑目标函数中常数步长随机梯度下降算法的渐近正态结果,结果表明只要非凸和非光滑目标函数满足耗散性特性,SGD 算法的迭代平均值就会渐近正态分布,该结果可用于构建对于使用 SGD 算法的非凸问题的置信区间。同时,本文通过对其 - 记忆约束下的分位数回归
本文研究基于有限内存约束的大样本分位数回归问题,提出一种计算效率高的分位数回归估计方法,实现多轮聚合即可得到与所有数据计算分位数回归一样的效果,并适用于分布式计算环境和实时数据处理。
- ICML随机效用模型的组合边际似然方法
本研究提出了一种新颖灵活的基于排名打破的复合边际似然 (RBCML) 框架,用于学习随机效用模型 (RUMs),包括 Plackett-Luce 模型,并利用证明严格对数凹性在卷积和边际化下得以保持的方法,表征了 RBCML 的目标函数为严 - 高维多元分布的假设检验:一篇选择性综述
本文评述了一些最近为高维多项分布提出的假设检验方法,并且指出了通过采取 minimax 的视角可以自然地得到强有力且实用的检验。
- 随机块模型的渐近有效估计器:朴素最大似然估计、带秩约束的最大似然估计和谱估计
使用谱嵌入来估计随机块模型图中的块概率矩阵 B,在平均度数以 n 的 Ω(√n) 的速率增长时,我们建立了渐进正常性结果;当 B 是全秩的时,从谱嵌入得到的 B 的估计是渐近有效的;当 B 是奇异的时,从谱嵌入得到的估计可以比在没有排名假设 - 并行平均随机梯度算法收敛率
介绍了一种并行的平均随机梯度算法,能够高效地递归处理高维空间中的大样本数据,并给出了强凸目标和局部强凸目标的平均收敛速度和渐近正态性。
- 变分贝叶斯方法的频率派一致性
本文证明了变分贝叶斯法在频率学意义下是稳健的,它可以通过极小化 KL 散度来估计后验分布,并且其对应的参数的变分期望是一致的和渐近正态的。此理论应用于贝叶斯混合模型、Bayesian 广义线性混合模型和贝叶斯随机块模型,并通过模拟研究进行了 - 高维模型的统计理论
这篇论文讨论了 Lasso 和去稀疏化 Lasso 的预测误差、渐进线性性及其应用:构建感兴趣参数的置信区间和精度矩阵的去稀疏化估计器,同时考虑经典的 chaining 和通用的 generic chaining 方法,并结合浓度不等式来证 - LAD 回归和其他 Z - 估计问题的均匀后选择推断
基于 Neyman 的正交阵,我们开发了一种方法来产生高维稀疏中位数回归模型中回归系数的一致有效的置信区间,同时我们将所提出的估计器的渐近正常分布性扩展到所有特定目标参数并建立一致的渐近正常性以及同时置信带。
- 高维线性模型低维参数的置信区间
本文提出了一种针对高维数据中低维度参数的统计推断方法,重点在于构建线性回归模型中单个系数和多个系数的线性组合的置信区间,提出的估计器在趋于无穷时渐近正态,其有限维协方差矩阵的一致估计器满足充分条件,模拟结果证明了置信区间的覆盖概率准确性,强 - 分层抽样中的自适应最优分配
本文提出了一种分层抽样算法,其中在每个分层进行的随机抽样用于自适应修改各分层进一步抽样的比例,这些比例收敛于方差减少的最佳分配,我们的分层估计器渐近正态,渐近方差等于最小方差,数值实验证实了算法的效率。