软量化基于熵正则化
该研究通过引入熵平滑,将 Carlier 等人(2014)所提出的 Wasserstein 变分问题的对偶式正则化,从而处理了涉及 Wasserstein 距离的计算问题,得到了更容易实现和数值更稳定的优化问题,应用于计算 Wasserstein 重心和空间规则化函数的梯度流。
Mar, 2015
本文针对高维离散量之间的 Wasserstein 距离提出了具有鲁棒性的 “Max-Min” 方案,通过将量投影到一个较低维的子空间来最大化它们之间的距离。此外,我们提出了一种基于熵正则化的算法来解决相关问题,并在实验中显示了其优越性。
Jan, 2019
应用最优输运及熵正则化计算 Wasserstein 距离中的 Sinkhorn 近似算法的梯度,可以提高学习和优化问题的效率,同时通过高阶平滑性,也可以提供统计保证。
May, 2018
在这项研究中,我们探讨了在概率空间上定义的 Sobolev 平滑函数的数值逼近的挑战性问题。我们采用三种基于机器学习的方法,通过求解有限个最优传输问题和计算相应的 Wasserstein 潜势,使用 Wasserstein Sobolev 空间中的经验风险最小化和 Tikhonov 正则化,以及通过表征 Tikhonov 泛函的 Euler-Lagrange 方程的弱形式来解决这个问题。作为理论贡献,我们对每种解决方法的泛化误差提供了明确且定量的界限。在数值实现中,我们利用适当设计的神经网络作为基函数,经过多种方法的训练,使我们能够在训练后快速评估逼近函数。因此,我们的构造性解决方案在相同准确性下显著提高了评估速度,超过了现有方法数个数量级。
Oct, 2023
本研究提出了一种先进的神经网络剪枝技术,通过在计算经验 Fisher 信息矩阵(FIM)过程中巧妙处理嘈杂的梯度。我们介绍了一种基于几何属性的熵 Wasserstein 回归(EWR)模型,通过采用数据点之间的邻域插值实现噪声缓解。Wasserstein 距离的独特优势在于平衡噪声降低和协方差信息保留之间的关系。通过在各种网络上进行广泛实验证明,所提出的方法在网络剪枝算法中具有与先进方法相当的性能。当网络规模或目标稀疏度较大时,我们提出的方法在存在嘈杂梯度的情况下效果更为显著,可能来自嘈杂数据、模拟存储器或对抗攻击。值得注意的是,我们的方法在仅剩不到四分之一的网络参数的情况下,使 MobileNetV1 的准确度提高了 6%,测试损失提高了 8%。
Oct, 2023
本文提出了基于 Wasserstein 距离的预期泛化误差界限,并分别介绍了全数据集、单字母和随机子集限制,以及从 Steinke 和 Zakynthinou [1] 的随机子抽样设置中的类似物。此外,当损失函数有界且选择 Wasserstein 距离中的度量时,这些界从相对熵的基础上得到了更好的下限 (因此是更紧的)。在特定情况下,这些结果可以被看作是考虑了假设空间几何和基于相关熵的界限之间的桥梁。另外,本文还介绍了如何基于这些界限产生各种新的界限,并使用类似的证明技术得出关于后向通道的类似界限。
Jan, 2021
本文提出了一种基于分布鲁棒性的方法来控制线性离散动态系统,在随机加性干扰作用下具有二次成本。假设干扰过程的基础概率分布为未知的,但被认为位于给定的分布半径球中,用 Wasserstein 距离求得。在此框架中,设计了严格因果线性干扰反馈控制器来最小化最坏情况下期望遗憾。通过对最优运输问题的对偶理论建立,可将此遗憾最小化控制问题重新等价为一个可行的半定编程问题。该等效对偶公式还允许我们确定中心分布与最坏情况下分布之间的最坏情况下期望遗憾。
Apr, 2023
本文提供一种简单的过程,用于将生成网络适配成目标分布,从而实现小的 Wasserstein 距离,从而逐渐将生成器网络调整为目标分布。在 MNIST 和 Thin-8 数据的训练和测试集上,实现了良好的性能。
Jun, 2019
对线性可解的 MDP 和线性二次调节器采用 Tsallis 熵来实现正则化,从而在探索和控制规律的稀疏性之间取得平衡。
Mar, 2024