- 强化学习的非参数贝尔曼映射:稳健自适应滤波应用
本文设计了一种在再生核希尔伯特空间(RKHSs)中的新型非参数 Bellman 映射,用于强化学习。该方法利用 RKHS 的丰富逼近性质,不依赖数据的统计属性,不需要马尔可夫决策过程的转移概率知识,并可以在没有训练数据的情况下进行操作。该方 - 利用神经网络逼近 RKHS 函数
通过使用神经网络来近似再生核希尔伯特空间中的泛函的普适性,以及将其应用于广义函数线性模型的函数回归,本研究探讨了将功能性数据(如时间序列和图像)整合到神经网络中学习函数空间到 R 的映射(即泛函)的方法。同时,通过在再生核希尔伯特空间中建立 - 关于核函数的近似方法
统计学习中的各种方法建立在再生核 Hilbert 空间中的核上。在应用中,核通常根据问题和数据的特征进行选择,然后用于在未观察到解释性数据的点处推断响应变量。本文考虑了在高维紧致集合中定位的数据,并且对核本身的近似进行了讨论。新的方法考虑了 - 使用核函数的流形度量匹配用于生成建模
该文章提出了一个概率测度传输的一般框架,利用常微分方程和再生核希尔伯特空间进行最小差异生成建模和采样,受到微分同胚匹配和图像注册的思想的启发。通过理论分析,给出了该方法的先验误差界限,包括模型复杂度、训练集中的样本数量和模型规范错误等因素。 - 再生核希尔伯特空间中的 Lipschitz 与 Hölder 连续性
在这项工作中,我们研究了再生核希尔伯特空间中的 Lipschitz 和 Hölder 连续性,并提供了多个充分条件以及对诱导规定的 Lipschitz 或 Hölder 连续性的再生核的深入研究。除了新结果外,我们还收集了相关的已知结果,使 - 强化学习中使用的近似本地空间的收敛速率
该论文研究了出现在再生核希尔伯特空间 (RKHS) H (Ω) 的一组值函数逼近的收敛速度。通过在特定类别的本地空间中建立一个最优控制问题,得出了政策迭代中出现的离线逼近的强收敛速度。利用有限维逼近空间 H_N 的幂函数 Pwr_{H,N} - 强化学习的近端 Bellman 映射及其鲁棒自适应滤波应用
本文介绍了一种基于复习核希尔伯特空间的近似 Bellman 映射类,该映射类对于所有折损因子的值都属于强力的希尔伯特非扩张映射家族,具备丰富的设计自由度,能够重现经典 Bellman 映射的属性,并为新型强化学习设计铺平道路。在提出的映射类 - 基于有理内核的插值方法用于复频响函数
通过引入复值函数的再生核希尔伯特空间,并构造具有核配对的复值插值问题,将插值器与低阶有理函数相结合,基于新的模型选择准则自适应选择阶数,对来自不同领域的例子进行数值实验,展示了该方法的性能,并与现有的有理逼近方法进行比较。
- 协变量转移适应中的一般正则化
通过重新加权样本,本研究在再生核希尔伯特空间中修正最小二乘学习算法的误差,以解决未来数据分布与训练数据分布不同引起的问题,并证明在弱平滑条件下,相比现有分析所证明的,为了达到与标准监督学习相同精度所需的样本数量更小。
- ICML神经希尔伯特梯级:函数空间内的多层神经网络
本文探讨了深度神经网络的函数空间和复杂度测量方面的问题,将一个多层神经网络看作是一种特定层次的再生核希尔伯特空间,并研究了它的理论性质和推论。
- $L^\infty$ 重心核希尔伯特空间的可学习性
本文分析了在 L^∞范数下再现核希尔伯特空间(RKHS)的可学习性,与核方法和随机特征模型在安全和安全关键应用中的性能密切相关,建立了样本复杂度的下限和上限,并证明了在球面上的点积核下,如果 β 与输入维度 $d$ 无关,则可以使用多项式样 - Mercer 核的绝对可积性仅仅对 RKHS 稳定性是充分条件
本文探讨了稳定的重构核希尔伯特空间(RKHS)在连续时间下的 Mercer Kernel 存在时的稳定性条件,旨在通过对稳定 RKHSs 的研究为输入输出数据估计线性、时变和 BIBO 稳定动态系统提供理论支持。
- 再生核希尔伯特空间的稳定性测试
通过研究 Mercer(连续)核在连续时间和整个离散时间类中,我们表明稳定性测试可以缩减到仅研究测试函数上的核算子,这些函数几乎可以在任何时候只取值于 1 和 - 1。因此,RKHS 稳定性测试成为单个线性时不变系统的 BIBO 稳定性的简 - 核方法在算子学习中有竞争力
本文提出了一个用于学习 Banach 空间之间的算子的核心框架,该框架基于重现核希尔伯特空间 (RKHS),并提供了先验误差分析和与神经网络方法的全面数字比较。
- 核仿射壳机与差分隐私学习
本研究探讨通过在再生核希尔伯特空间中利用点的仿射包作为表示数据的一种方式,不仅可以将数据空间划分为几何体来隐藏个体数据点的隐私敏感信息,同时能保留原始学习问题的结构。我们介绍了 Kernel Affine Hull Machine (KAH - 混淆核化赌博机的双重仪器方法
本论文中,我们解决了在 contextual bandit 问题中噪声被 confounder 影响的问题,引入了潜在的 confounder,并且应用了双重工具变量回归来解决 reward function 估计中的偏差问题,设计出基于理 - 再生核希尔伯特空间中线性泛函的实验设计
研究最优实验设计,针对再生核希尔伯特空间(RKHS)中的线性泛函估计,提供了构建偏差感知设计的算法,并推导出在次高斯噪声下的固定和自适应设计的非渐进置信集,使得可以高概率地证明具有有界误差的估计。
- 基于核的时间差分方法的最优策略评估
本文提出一种基于重现核希尔伯特空间的方法来估算无限时间折扣马尔可夫奖励过程的值函数的方法,并使用经验过程理论技术导出了误差的上界,同时证明了在样本大小 n 和有效时间跨度 H = (1-gamma)^{-1} 方面具有最优的最小值。
- 量子核函数的归纳偏差
通过分析量子核心函数类的光谱特性,我们发现如果其再现核希尔伯特空间具有低维度且包含传统计算难度的函数,则存在量子优势;然而,合适的量子核心函数不易找到,而该偏置相对于经典模型在量子机器学习模型速度提升方面是必须的。
- 插值方法下最小二乘 SGD 的最终收敛迭代
研究了神经网络在最小二乘设置中的应用,讨论了随机梯度下降与最终迭代的相关性,并在统计和优化双重视角下给出了多项式瞬时收敛率的解读,建立与再生核希尔伯特空间的联系。