- 通过核化多臂赌博机进行分布式优化
该研究论文提出了一种基于分布式优化和多臂赌博算法 (Multi-armed bandit) 的全分散算法 (Multi-agent IGP-UCB),以最小化代理间的遗憾值,并在保护隐私的同时提供了改进的性能。
- 张量再生核希尔伯特空间中的安全强化学习
本文探讨了在部分可观察环境下的安全强化学习问题,旨在实现安全可达性目标。通过提出一种基于随机模型的方法,在面对未知系统动态和部分观测环境时,几乎确定地保证了强化学习的安全性。利用预测状态表示和再生核希尔伯特空间,对未来的多步观测进行了解析表 - 在再生核希尔伯特空间中通过杠杆得分采样实现高效数值积分
在本研究中,我们考虑了数值积分的问题,即仅使用对被积函数进行逐点评估的方法,用目标概率测度来近似积分。我们提出了一种有效的程序,利用所给的包含有 n 个独立同分布的观测样本和总体分布密切相关的再现核希尔伯特空间中的积分函数。我们的主要结果是 - 用于核高斯混合模型的最优传输
通过核技巧在再生核希尔伯特空间中提出了计算两个高斯混合模型之间距离的沃瑟斯坦类型度量的方法。
- 基于核的非参数回归的最小化最优迁移学习
通过研究转移学习在非参数回归问题上的应用,本文提出了两种解决方案:已知转移源时使用基于核岭回归的两步核估计器,未知转移源时使用基于高效集成算法的新方法,该方法可以自动检测并减轻负面源的影响,并通过大量的数值实验证实了理论结果并展示了提出的方 - 面向协变量偏移条件下核方法统一分析的探究
统一分析了具有协变量转移的一般非参数方法在再生核希尔伯特空间下的理论,得出了收敛速度,并与现有文献中使用的最优结果相吻合。在合成和实际例子上进行的广泛数值研究证实了我们的理论发现,进一步说明了我们提出的方法的有效性。
- 对抗语境强化学习的核化方法
通过将属于再现核希尔伯特空间的损失函数纳入到对手性线性背景乐队的在线学习问题的研究中,我们提出了一种计算有效的算法,该算法利用一种新的对损失函数进行乐观偏差估计的方法,在对底层内核进行的各种特征值衰减假设下实现接近最佳的后悔保证。
- 利用再生核空间插值和模型减缩训练神经网络
使用内插技术从再生核希尔伯特空间理论中介绍和研究训练神经网络的理论,进而泛化到 Krein 空间,并展示了广泛使用的神经网络体系结构是再生核 Krein 空间的子集。通过多个复变量函数的理论概念,证明了著名的 Adamjan-Arov-Kr - 在 RKHS 中的密度比自适应学习
通过分析一类正则化 Bregman 散度的密度比率估计方法,我们得出新的有限样本误差界,并提出一种 Lepskii 类的参数选择原则,在不知道密度比率的规则性的情况下最小化误差界。在二次损失的特殊情况下,我们的方法能够自适应地达到极小极大误 - 基于投影算子的两视图学习任务的可扩展变量选择
本文提出了一种基于投影算子和相关性度量的变量选择方法,能够处理大规模的选择任务,并通过实验证明了其可行性。
- 宽残差网络的泛化能力
本文研究了 ReLU 激活函数下宽残差网络在球面上的泛化能力,并且证明了残差网络核(RNK)在宽度趋近于无穷时一致收敛于残差神经切向核(RNTK),最终说明了残差网络的泛化误差总是趋近于 RNTK 的核回归误差,而早停策略下的宽残差网络可以 - 自监督学习的核 KL 散度
该研究通过重现核希尔伯特空间理解现有的许多非对比学习方法,提出了一种新的核 SSL 损失函数,可直接优化 RKHS 中的均值嵌入和协方差算子,并在 ImageNet 数据集上的线性评估设置下大幅优于现有技术方法。
- 关于错配核岭回归的最优性
本论文证明了当 H 是一个 Sobolev RKHS 时,对于任何 0 < s < 1,KRR 都是极小化最优的,解决了长期存在的问题。
- 函数学习的分布式梯度下降
我们提出了一种 DGDFL 算法,它是一种分布式迭代训练方法,适用于在多台本地计算机上处理大规模的功能数据,实现了功能数据分析的阶段性丰富。
- 一种对随机特征模型和两层神经网络进行泛化分析的二元框架
本研究通过对学习 Fp,π 和 Barron 空间中的函数这一问题的探讨,揭示了这些空间的逼近和估计可以在某种意义上等价。这使我们能够将重点放在逼近和估计这一较容易的问题上,当研究两个模型的泛化时。此外,我们通过两个具体的应用程序全面分析了 - 核化赌博机中适应误差核正则性
研究了在核化赌博机问题中,在未知正则性的情况下学习算法是否能够自适应于相关核函数的正则性。通过研究转化不变核的正则性自适应性,我们推导出自适应性的下限,证明不可能在具有不同规则性的 RKHS 对中同时实现最优累计遗憾。通过连接在不同功能空间 - ICLR预处理函数梯度流粒子变分推断
本文提出一种名为 PFG 的新粒子变分推断算法,采用一种 functional regularization 方法,支持更广泛的函数类,同时具有更好的可伸缩性和对恶劣条件分布的适应性,在渐进意义下连续地收敛于 KL 散度。
- 使用通用深度域适应框架预热跨会话运动想象分类
提出了一种用于跨会话 MI 分类的全新的深度域自适应 (SDDA) 框架,并应用于既有的人工神经网络中,以提高模型的泛化能力与分类准确率。通过两项 MI-EEG 公共数据集上的实验证明,所提出的 SDDA 框架能够显著提高 EEGNet 和 - 一个强健的相位消除算法,用于容错高斯过程赌博机
针对连续的、昂贵的评估的未知、有噪音和对抗性损坏的奖励函数的时序优化问题,提出了一种新的强化的消除型算法,称为 RGP-PE,它成功地平衡了对于削弱性的稳健性和探索和开发,其性能不会因存在(或不存在)对抗性污染而降低。
- 紧致的 RKHS 元素在线置信区间的开放问题
研究了基于核的赌博机和强化学习问题,利用可再生核希尔伯特空间 (RKHS) 元素的置信区间,发现现有置信区间似乎不紧,导致次优的遗憾度界限,存在几种核化赌博机算法 (例如 GP-UCB,GP-TS 及其变种) 的现有遗憾度界限可能甚至不能达