- 巴拿赫空间之间全纯算子的最优深度学习
通过将任意近似编码器和解码器与标准前馈深度神经网络 (DNN) 体系结构相结合,我们提出了学习巴拿赫空间之间的算子的问题。我们首先确定了一组 DNN 的族群,使得由这些深度学习 (DL) 过程所获得的产生出算子可以达到最佳的泛化性能。接下来 - 算子学习与通用逼近的投影方法
应用 Leray-Schauder 映射,在任意 Banach 空间上获得了连续算子的新的普遍逼近定理,并在函数的多个变量的 Banach 空间 $L^p$ 中基于多项式基的正交投影引入并研究了一种算子学习方法。在一些额外假设下,我们导出了 - 具有多元非线性的神经结构的巴拿赫空间优化性
通过构建一类新的经过正则化操作与 $k$-plane 变换定义的 Banach 空间,并证明具有多元非线性的神经结构是这些 Banach 空间中学习问题解集的完全刻画,我们研究了一大类神经结构的变分最优性(具体而言指 Banach 空间的最 - 核方法在算子学习中有竞争力
本文提出了一个用于学习 Banach 空间之间的算子的核心框架,该框架基于重现核希尔伯特空间 (RKHS),并提供了先验误差分析和与神经网络方法的全面数字比较。
- MMTransformer 是深度无限维非 Mercer 二元核机器
本文提出了一种新的理解 Transformer 模型的视角 —— 将其核心操作 Dot-product attention 视为 Banach 空间对的核学习方法,从而推导出该模型具有无限特征维数。同时,本文还将标准核学习问题扩展到了二元情 - 关于多层 ReLU 网络相关的 Banach 空间:函数表示、逼近理论和梯度下降动态
本文提出了适用于 ReLU 神经网络的 Banach 空间,其中包含了所有有限全连接 L 层网络及其 L^2 - 极限对象,具有低的 Rademacher 复杂性和良好的泛化特性,函数可以通过多层神经网络进行近似,收敛速率与维度无关。
- Banach Wasserstein GAN
本研究探索了 Wasserstein 生成对抗网络在巴拿赫空间中引入梯度惩罚后的理论扩展和一些具体选择的基础点,重点关注 Sobolev 范数,并在 CIFAR-10 和 CelebA 中展示了性能提升。
- 通过随机投影实现线性 Lipschitz 和 $C^1$ 扩展算子
使用规则随机投影将度量空间线性扩展 Lipschitz 和 $C^1$ 函数,进而更直接地证明了 Lee 和 Naor 的结果,并将 Whitney 的 $C^1$ 扩展定理推广到了 Banach 空间。
- NIPS模型选择实现无参在线学习
该研究提出了一种新型算法框架用于在线学习的模型选择,通过采用随机演出的基于新型算法框架的 “多尺度” 算法进行预测,可以在最小结构假设下,获得在线模型选择预言不等式,实现了一种通用的元算法框架,并进一步为矩阵类、非嵌套凸集等特殊模型提供了新 - 无限维空间上的分析与概率论
本文简要介绍了无限维空间中分析和概率基本概念、主要讨论 Banach 空间中的高斯测度。
- Banach 空间通用连续框架下的相位恢复
我们在 Banach 空间和连续框架的新颖和统一设置中开发了相位恢复问题,考虑由无相位测量进行重建的唯一性和稳定性,并证明了问题永远不会在无限维中统一稳定;对连续框架广义了互补性质(CP)的概念,并验证它是相位恢复问题唯一性的必要条件;同时 - 凸优化中的切比雪夫贪婪算法
该研究使用 Chebyshev 贪心算法在 Banach 空间中构建基于给定字典的稀疏近似解,证明了收敛速率成 Lebesgue 型不等式的形式,适用于凸优化问题。
- Banach 空间中鞅分布的最优界
提出了一种通用的设备,它可以将独立实值随机变量和 2 - 光滑 Banach 空间中累积随机变量的指数不等式进行扩展,用于获得 2 - 光滑 Banach 空间中鞅的 Rosenthal-Burkholder 和 Chung 等的最优值。进 - 带 l1 范数的再生核 Banach 空间
本文针对稀疏学习,构建函数 Banach 空间 B,该空间对于输入空间 X 中的可积函数采用计数测度下的 l1 范数与 B 等距同构;同时,点评价运算是 B 上的连续线性泛函,并且可表示为具有核函数的双线性形式;最后,本文证明了在 B 上正 - 几乎最优的无限制快速 Johnson-Lindenstrauss 变换
利用 Banach 空间中的概率新工具,将随机投影问题的研究推进到一个新的水平。其主要结果是可以线性映射任意 $N$ 个 $n$ 维实向量到一个 $O (log N polylog (n))$ 线性空间中,并在保持向量之间距离一定畸变的同时 - 高维概率论
该论文主要研究概率论、高斯过程、极限定理、经验过程和 Banach 空间的相关问题,讨论了这些问题在不同的结构限制下的特征与性质。
- 大矩阵取样:一种基于几何函数分析的方法
通过研究矩阵的随机子矩阵,证明了用最小可能 O(rlogr)的随机子矩阵(其中 r 是矩阵的数值秩),可以近似计算其谱范数,并给出了在该领域中的最优保证,并使用概率论的方法。Banach 空间中的操作型随机变量的大数定律证明了其工作原理。