- 高度不均匀采样下低秩矩阵补全的逐项界限
低秩矩阵补全问题关注使用稀疏观测的一组观测条目来估计矩阵中未观测的条目。我们考虑非均匀设置,其中观测条目根据高度变化的概率进行采样,可能具有不同的渐近尺度。我们证明了在结构化采样概率下,使用较小的子矩阵而不是整个矩阵上运行估计算法通常更好, - 统计课程学习:一种能实现预言风险的淘汰算法
我们提出了一种统计版本的课程学习(CL)方法,对参数预测问题进行建模。我们考虑三种不同的学习者类型,并提出了一种自适应多重淘汰回合的 CL 算法,用于估计目标参数向量,并确定其风险与弱预言者学习器的风险是否匹配。我们还研究了实例相关的极小极 - 广义线性模型中的隐私成本:算法与极小极大下界
使用构建的差分隐私版本的梯度下降算法,针对低维和高维稀疏广义线性模型提出参数估计,通过表征统计学性能和建立 GLMs 的隐私约束极小值下界来显示所提算法的近乎速率最优性。
- MM信息约束下交互式高维估计的统一下界
本文提出了一种统一的框架,用于基于交互式协议的分布式参数估计,可以导出各种紧密下限,适用于不同的参数分布族;特别是在高斯家族的原型情况下,我们的方法可以规避以往技术的局限性,并补充了匹配的上限。
- 方差缩减 $Q$- 学习达到了最小极差优化
介绍和分析了一种方差减少的 Q-learning 方法,为具有有限状态和动作空间的折扣 MDPs 提供了相对精确的最优 Q 函数估计,其采样数量与最小极值下界匹配。
- 具有最小最大保证的快速算法用于未知主题数量的主题模型
我们提出了一种新的主题模型估计方法,可以从观察到的数据中估计出主题数量 K,并在任意文档数量、单个文档长度、字典大小和主题数量的情况下实现了最小极小值下限和最新的上限估计。同时,在模拟研究中我们展示了这种新算法比现有的算法更快更准确。
- 稀疏因子模型下噪声矩阵完成的极小值下界
该论文研究了矩阵完成问题的基本错误特征,通过分析噪声模型下的最小极大误差边界得出,结果表明最大似然估计量的复杂性正则化可以在多个噪声场景下,获得最小风险率。
- 高维协方差矩阵估计与缺失观测
本文介绍了一种简单的过程来解决高维数据的缺失协方差矩阵估计问题,该方法不需要对缺失数据进行插补,并建立了非渐进稀疏奥尔克不等式,最后证明了其速率是渐进最优的。
- 主动学习插件方法
提出了一种基于非参数估计的回归函数的主动学习算法,并对其在广泛的基础分布类上可达到的推广误差收敛速率提供了概率界限,同时证明了最小化下限,展示了获得的速率几乎是紧密的。
- 凸编程中基于信息的复杂性、反馈和动态
通过反馈信息理论的视角,研究序列凸优化的内在限制。我们证明了,在优化算法中,为了获得最优解,算法必须能够积累关于目标的充分信息,这对于特定的假设和反馈类型限制了优化速度。我们的技术类似于统计学文献中用于估计程序风险的极小界,但不同之处是优化 - 插值分类器的快速学习率
研究揭示了插值分类器能够实现快速的过度贝叶斯风险收敛率,并证明了有时能够获得超快速收敛率,这与传统认知的最快收敛率为 $n^{-1}$ 不一致,而且通过最小化风险方法构造的分类器一般会收敛得更慢。