Sinkhorn 距离的模仿学习
通过 Sinkhorn 知识蒸馏方法,克服了传统教师 - 学生模式中 Kullback-Leibler 散度的模型坍缩、反 Kullback-Leibler 散度的模型平均以及 Jensen-Shannon 散度的模型低估等问题,有效地压缩大型语言模型并在多样的自然语言处理任务中取得了优越性能。
Feb, 2024
本文介绍了 Cuturi 的 Sinkhorn 距离的新分析方法,表明这种算法能够近似地在线性时间内计算出一般上的最优输运距离,同时提出了相应的一种新的贪心坐标下降算法 Greenkhorn,并通过数值模拟表明 Greenkhorn 在实践中比经典的 Sinkhorn 算法显著优越。
May, 2017
应用最优输运及熵正则化计算 Wasserstein 距离中的 Sinkhorn 近似算法的梯度,可以提高学习和优化问题的效率,同时通过高阶平滑性,也可以提供统计保证。
May, 2018
本文提出了一种新的最优传输距离家族,从最大熵的角度看待运输问题。在传统最优传输问题上加入熵正则化项,通过 Sinkhorn-Knopp 的矩阵缩放算法计算新的距离,显著提高了性能。
Jun, 2013
本文介绍了一种使用最优输送损失的可行计算方法,通过熵平滑和自动微分来减少计算负担、提高稳定性和平滑性,获得鲁棒和可微分的最优输送损失的逼近,从而训练大规模生成模型并补充标准深度网络生成模型的计算机架构。
Jun, 2017
本研究提出了一种新颖的策略以有效地近似两个离散度量之间的 Sinkhorn 距离。通过直接将可忽略的双重解的组件设置为该值,我们建议通过筛选这些组件来进入 Sinkhorn 问题。这基于 Sinkhorn 分歧问题的新增双重的新公式和该问题的 KKT 最优性条件,其可从该问题中识别可筛选的双重组件,从而确保了可证明的近似。在包括规则化最优输送的复杂任务中,我们展示了 Screenkhorn 的效率,例如维数约简和领域适应。
Jun, 2019
本文介绍了一种新的计算 Sinkhorn 距离的方法,该方法结合了 Nyström 方法和 Sinkhorn Scaling,具有显著的计算效率,适用于海量数据。
Dec, 2018
使用最优传输距离(OT)和尤其是熵正则化 OT 距离作为机器学习和数据科学中的一种评估度量越来越普遍。本研究主要针对在线 Sinkhorn 算法进行改进和优化,提出了改进的收敛性分析和压缩技术结合的在线 Sinkhorn 算法,通过实证实验和理论证明验证了方法的有效性和性能。
Oct, 2023
我们提出了一种新的框架,用于在马尔科夫链之间制定最佳输运距离的形式化。我们将此问题转化为在约化空间中求解线性规划的问题,并且通过 Sinkhorn Value Iteration 方法计算最佳输运距离,从而得到与马尔科夫链的 bisimulation metrics 完全匹配的结果。
Jun, 2024
利用差分隐私训练基于最优输运的生成模型,避免了隐私数据的直接使用,并可有效控制偏差 - 方差交换,此方法能够在多个图像建模基准测试中改进现有技术并合成 RGB 图像。
Nov, 2021