非独立同分布数据的色彩 PAC-Bayes 界限:在排名和稳定 β- 混合过程中的应用
该研究探讨了基于数据相关分布的随机预测模型在训练后的泛化能力以及基于 PAC-Bayes 分析的上界推导方法,同时研究了使用数据相关先验分布的应用,包括针对无界方差的损失函数的一种新颖的边界推导方法。
Jun, 2020
我们从 PAC-Bayesian 的角度提出了数据相关的均匀泛化界,通过将训练算法输出的数据相关假设集应用于随机集的严格方法,我们证明了数据相关的界,适用于多种情境,并将此方法应用于基于分形维度的泛化界和连续 Langevin 动力学以及随机梯度 Langevin 动力学的轨迹上,这些结果为噪声算法的泛化特性提供了新的信息。
Apr, 2024
该研究利用分解的 PAC-Bayes 边界框架得出一个可适配任意复杂度度量的一般泛化边界,其中关键步骤是考虑一系列常用的分布:Gibbs 分布。该边界在概率上同时适用于假设和学习样本,允许复杂度根据泛化差距进行调整,以适应假设类和任务。
Feb, 2024
在这篇论文中,我们推导了一个 PAC-Bayes 界限,用于一类特殊的离散时间非线性动力系统的监督时间序列设置。这个类别包括稳定的递归神经网络(RNN),而这项工作的动机就是应用于 RNN。我们在允许的模型上施加一些稳定性约束,这里的稳定性是以动力系统的概念来理解的。对于 RNN,这些稳定性条件可以表示为关于权重的条件。我们假设所涉及的过程在本质上是有界的,并且损失函数是利普希茨的。所提出的对于泛化差距的界限依赖于数据分布的混合系数和数据的本质上最大值。此外,随着数据集大小的增加,这个界限收敛于零。在这篇论文中,我们 1)正式化了学习问题,2)为这类系统推导了一个 PAC-Bayesian 误差界限,3)讨论了这个误差界限的各种结果,以及 4)展示了一个说明性例子,并讨论了计算所提出的界限的方法。与其他可用的界限不同,这个推导的界限适用于非独立同分布的数据(时序数据),并且它不随 RNN 的步骤数增长。
Dec, 2023
通过使用 (f,Γ) 差异得出新的 PAC-Bayes 广义边界,本文还提供了一系列概率差异 (包括但不限于 KL、Wasserstein 和总变差) 的 PAC-Bayes 广义边界,在后验分布性质不同的情况下选择最佳解,我们探索了这些边界的紧密程度并与统计学习的之前结果联系起来,这也是特定情况。此外,我们将这些边界作为训练目标实例化,提供非平凡的保证和实际性能。
Feb, 2024
本文旨在扩展 Rademacher 复杂性和最新 PAC - 贝叶斯理论之间的桥梁,首先通过平移 Rademacher 过程来匹配 Catoni PAC-Bayes 界限的快速率,然后最新地导出了快速 PAC-Bayes 界限,重点是后验集中在的经验风险表面的 “平坦度”。
Aug, 2019
该论文提出了一种新的高概率 PAC-Bayes 界限,其中涉及到了带界范围和更一般尾部行为的损失,并提出了一些新的基于参数和基于事件的界限技术,可以得到更紧密和可解释的结果,并将结果扩展到任何现有范围上
Jun, 2023
通过 PAC Bayes 框架进行校准误差的泛化分析,并提出了一个基于该泛化理论的智能校准算法。数值实验表明,该算法提高了基于高斯过程的校准性能。
Jun, 2024
文中提出了一种利用概率去相关引理、对测度空间中的的概率测度进行对称化、配对和链化等技术来获得学习算法信息论泛化界限的一般性方法,进而得到新的期望值和高概率条件下泛化误差的上界,特别地,还包括了基于互信息、条件互信息、随机链和 PAC-Bayes 不等式等现有泛化界限的特例。此外,Fernique-Talagrand 上界也是一个特例。
May, 2023