- 在 Wasserstein 距离中的最优实例私有密度估计
使用 Wasserstein 距离对分布进行差分私密密度估计,并设计了可以适应简单实例的实例最优算法,对于特殊情况下的离散分布,结果还导致了 TV 距离下的实例最优私密学习。
- 一致性扩散模型的可证明统计速率
本文提出了一种统计理论,将一致性模型的训练视为分布差异最小化问题,并通过使用 Wasserstein 距离,导出了与传统扩散模型相匹配的一致性模型的统计估计速率,同时揭示了一致性模型通过蒸馏和隔离方法进行训练的优势。
- 具有局部和全局对抗性破坏的强健分布学习
在对抗性环境中,考虑利用计算上高效的估计器最小化 Wasserstein 距离,并开发具有有界误差的有限样本算法,用于鲁棒性随机优化。
- 使用参数化神经网络重建跳跃扩散过程的高效瓦辛斯坦距离方法
通过分析两个多维跳扩散过程的概率分布之间的 Wasserstein 距离(W - 距离),我们提出了一种时间解耦的平方 W_2 - 距离方法,该方法提供了与两个跳扩散过程的漂移、扩散和跳跃幅度函数之间的差异相关的上下界。然后,我们利用参数化 - 稀疏展开和神经元解缠
我们展示了如何通过将 LLM 扩展为稀疏专家的混合体来提高其推理效率,其中每个专家是原始权重的副本,经过一次性修剪以特定输入值簇的方式修剪。我们称这种方法为 ' 稀疏扩展 '。我们展示了对于像 LLama 270B 这样的模型,随着稀疏专家 - 动态贝叶斯优化中去除陈旧观察
设计了一种基于 Wasserstein 距离的准则来评估观测结果对未来预测的相关性,并利用该准则构建了一种名为 W-DBO 的动态贝叶斯优化算法,能够实时删除无关观测结果,从而在未知时间范围内的连续时间优化任务中同时具备良好的预测性能和高采 - 快速评估 Ollivier-Ricci 曲率下界:理论与计算的桥梁
我们提出了一种使用 Wasserstein 距离的广义 Ricci 曲率(ORC)的简化方法,该方法在计算复杂性上具有线性,特别适用于分析大规模网络,并通过大量模拟和对合成和真实数据集的应用来展示了该方法在评估 ORC 方面的显著改进。
- 基于统计检验理论视角对于外域识别的观点
我们研究了在监督学习和无监督学习环境中在测试时高效检测超出分布(OOD)样本的问题。通过统计检测重新定义 OOD 问题,研究了在统计术语中使 OOD 问题可识别的条件,并在 Wasserstein 距离的基础上研究了 OOD 测试的收敛性保 - 带随机噪声的私密瓦石坦距离
该研究通过研究 Wasserstein 空间中的三角属性,提出了一种名为 TriangleWad 的简单解决方案,可以在不同实体之间计算存储的数据集之间的 Wasserstein 距离。该方法使原始数据信息变得真正不可见,提高了对攻击的抵抗 - 常步长非光滑收敛 SA 的预连续耦合和稳态收敛
基于 Q-learning,本研究研究了具有恒定步长的非光滑压缩随机逼近(SA)。我们关注两类重要的动态:1)具有加性噪声的非光滑压缩 SA,和 2)具有加性和乘性噪声的同步和异步 Q-learning。对于这两种动态,我们证明了迭代在 W - 通过流形假设的视角解析深度生成模型:一项调查与新连接
深度生成模型与流形假设之间的相互作用引起了人们的广泛关注。本文通过流形视角对 DGM 进行了首次调查,并对其进行了两个新的贡献:首先,形式上证明了高维似然函数的数值不稳定性是无法避免的;其次,发现基于自编码器的 DGM 可以被解释为近似最小 - 有条件的 Wasserstein 距离在贝叶斯 OT 流匹配中的应用
本文介绍了通过一组有限的耦合来定义条件 Wasserstein 距离,通过松弛条件 Wasserstein 距离来近似速度场,提出了 OT Flow Matching 的扩展,并展示了其在贝叶斯逆问题和条件图像生成中的数值优势。
- 通过遗传编程演化基准函数比较进化算法
利用遗传规划(GP)生成新的优化基准函数,通过利用 Wasserstein 距离和 MAP-Elites 方法,我们展示 GP 生成的基准函数能够更好地区分算法,并自动设计、比较进化算法。
- Cartan-Hadamard 流形上的切片 Wasserstein 距离和流动
在这份研究论文中,我们探讨了在已知非欧几里德几何特性的数据上,机器学习方法在黎曼流形上的应用以及最优输运方法在该领域的研究。我们提出了在卡尔曼 - 哈达玛德流形上的分片瓦砾斯坦距离,该方法在欧几里德空间上具有闭合解,并且我们还探索了该方法在 - OTClean: 条件独立性违反数据清洗的最优输运方法
我们介绍了一种利用最优输运理论进行条件独立性约束下数据修复的框架,并将该问题转化为正则化的优化问题,提出了一种受 Sinkhorn 算法启发的迭代算法来解决高维大规模数据的计算问题。通过广泛的实验,我们证明了该方法在实际数据清洗和预处理任务 - 持久图的量子距离近似
本文研究了拓扑数据分析方法在分类和聚类任务中的应用,特别是通过使用持续图可以总结有关可能复杂和高维数据集形状的重要信息。我们探索了量子计算机用于估计持续图之间距离的潜力,提出了用于 Wasserstein 距离和 $d^{c}_{p}$ 距 - Lipschitz 可配置马尔可夫决策过程的性能改进界限
研究了满足 Lipschitz 连续性的 Configurable Markov Decision Processes(Conf-MDPs)的性能改进下界。
- MM对数值逼近随机微分方程的分布的瓦瑟斯坦距离估计的修正
通过分析 UBU 积分器的局部误差估计,将实践中观察到的维度依赖与理论相协调,从而提出了一种在 Wasserstein-2 距离中分析非渐进保证的方法,以对遍历式 SDE 的数值离散化进行评估。
- 立体地球切片瓦塞尔斯坦距离
本论文介绍了一种用于比较球形概率测度的高速、高度并行化的距离度量方法 ——Stereographic Spherical Sliced Wasserstein (S3W) 距离,并通过广泛的理论分析和数值研究评估了该距离与最近基准方法在速度 - 深度条件生成学习:模型和误差分析
我们介绍了一种基于常微分方程(ODE)的深度生成方法,称为条件 Follmer 流。该方法能够将标准高斯分布有效地转换为目标条件分布。在实现上,我们使用欧拉方法离散化流,并使用深度神经网络非参数地估计速度场。此外,我们推导出学习样本分布与目