正则化数据拟合的更锐利界限

Nov, 2016

Sharper Bounds for Regularized Data Fitting

Haim Avron, Kenneth L. Clarkson, David P. Woodruff

TL;DR研究针对线性回归、低秩逼近和规范相关分析的正规化变体的矩阵草图方法，主要关注能够保留规范问题目标函数值的草图技术，为 ridge regularization 在这些问题上展示了算法资源界限，其中统计维度总是小于秩，并随着规范化程度的增加而减少

Abstract

We study matrix sketching methods for regularized variants of linear regression, low rank approximation, and canonical correlation analysis

matrix sketching regularization linear regression low rank approximation canonical correlation analysis

发现论文，激发创造

岭回归的算法和下界草图

提出了基于草图的迭代算法，用于解决均方误差损失函数加正则项的岭回归问题，针对早期工作中的子空间嵌入要求而使用更弱的近似矩阵乘法保证，为核岭回归提供了更快的算法，同时我们对均方误差损失函数的算法框架提出了切实可行的草图规模下限。

Apr, 2022

最大边际自由度的上界

这篇文章研究了核岭回归中的低秩逼近和替代方法，通过引入降维算法和核函数的正则性，探讨了降维逼近的有效维度与正则化参数的增长关系，并证明了对于合适的核函数，这种增长是渐近对数的，从而使得低秩逼近成为纽斯特伦方法。

Feb, 2024

稀疏线性回归的最优草图界限

该论文探讨了在不同的损失函数下，对于 $k$- 稀疏线性回归的随机抽样方法以及其误差上界，其中包括了稀疏的逻辑回归和 ReLU 回归等损失函数，并且给出了相应的维度约束条件。

Apr, 2023

随机投影的精确表达式：低秩逼近与随机牛顿

利用随机矩阵的谱分析最新进展，我们开发了一种新的技术，提供了随机投影矩阵的期望值的确切表达式，这些表达式可以用来表征多种常见的机器学习任务中的降维性能，包括低秩估计和迭代随机优化等。我们的结果适用于多种流行的草图方法，包括高斯和 Rademacher 草图，结果表明，我们推导出的表达式反映了这些草图方法的实际性能，甚至体现了较低阶效应和恒定因子。

Jun, 2020

具有统计保证的快速随机核方法

本文章介绍了一种改进基于核方法的机器学习方法运行时间的方法，并提出了一个计算算法，该算法可以用来在不需要生成全核矩阵的情况下，对特征向量矩阵进行采样，并在统计表现和运行时间方面提供了新的保证。

Nov, 2014

一种解决降秩算子回归的随机算法

我们提出并分析了一种算法，用于解决涉及可能是无限维输入和输出空间的矢量值回归问题。该算法是降低秩回归的随机化改进，通过带有秩约束的正则化经验风险最小化来优化学习低秩矢量值函数（即运算符）与采样数据之间的关系。我们提出了基于高斯草图技术的原始和对偶优化目标，产生了高效准确的随机降秩回归（R4）估计器。对于我们的每个 R4 算法，我们证明了在适当调整超参数的情况下，随机草图的随机性的期望下，所得到的正则化经验风险将任意接近最优值。数值实验证明了我们界限的紧凑性，并展示了两种不同情景的优势：（i）使用合成和大规模神经科学数据集解决矢量值回归问题，以及（ii）回归非线性随机动力系统的 Koopman 运算符。

Dec, 2023

低秩张量回归的近似最优素描

本文介绍了针对最小二乘回归问题的 CP 和 Tucker 分解模型，以及基于稀疏随机投影的数据降维技术，旨在减小模型参数数量和计算量。作者通过数值模拟得到了实验结果，证实了其理论的有效性。

Sep, 2017

迭代 Hessian 草图：约束最小二乘问题的快速准确解近似

本文研究了随机草图方法，以近似解决带有一般凸约束的最小二乘问题，并提出了一种名为迭代 Hessian 草图的新方法，同时提供了数值模拟实验，包括面部表情分类实验。

Nov, 2014

高维稳健回归估计的非正则化和岭正则化的渐近行为：严格结果

本文研究了高维稳健回归估计器的渐近性质以及基于概率启发式的方法解释了其渐近行为，通过随机矩阵理论、集中测度和凸分析的思想提出了严谨证明，这里对某些假设进行了放宽并发现当 $ au=0$ 时可作为极限情况来恢复。

Nov, 2013

低秩核矩阵近似的尖锐分析

本文研究了在正定核框架下的监督学习问题，提出了基于随机矩阵列采样的核矩阵低秩近似方法，此方法可以在 sub-quadratic 的时间复杂度内有效解决核矩阵计算问题，同时保持预测性能不变。

Aug, 2012