Sinkhorn 距离的模仿学习

KDDAug, 2020

Imitation Learning with Sinkhorn Distances

Georgios Papagiannis, Yunpeng Li

TL;DR本文提出了一种将模仿学习看作是最小化占用量度量之间的 Sinkhorn 距离的可实现解决方案，并通过在对抗性学习特征空间中定义余弦距离成本，将最优运输度量的有价值特性与比较非重叠分布相结合。

Abstract

imitation learning algorithms have been interpreted as variants of divergence minimization problems. The ability to compare occupancy measures between experts and learners is crucial in their effectiveness in lea

imitation learning divergence minimization occupancy measures sinkhorn distance mujoco

发现论文，激发创造

Sinkhorn 距离最小化的知识蒸馏

通过 Sinkhorn 知识蒸馏方法，克服了传统教师 - 学生模式中 Kullback-Leibler 散度的模型坍缩、反 Kullback-Leibler 散度的模型平均以及 Jensen-Shannon 散度的模型低估等问题，有效地压缩大型语言模型并在多样的自然语言处理任务中取得了优越性能。

Feb, 2024

通过 Sinkhorn 迭代的近线性时间逼近算法优化输运问题

本文介绍了 Cuturi 的 Sinkhorn 距离的新分析方法，表明这种算法能够近似地在线性时间内计算出一般上的最优输运距离，同时提出了相应的一种新的贪心坐标下降算法 Greenkhorn，并通过数值模拟表明 Greenkhorn 在实践中比经典的 Sinkhorn 算法显著优越。

May, 2017

使用 Wasserstein 距离的 Sinkhorn 逼近的微分特性

应用最优输运及熵正则化计算 Wasserstein 距离中的 Sinkhorn 近似算法的梯度，可以提高学习和优化问题的效率，同时通过高阶平滑性，也可以提供统计保证。

May, 2018

Sinkhorn 距离：最优输运距离的高速计算

本文提出了一种新的最优传输距离家族，从最大熵的角度看待运输问题。在传统最优传输问题上加入熵正则化项，通过 Sinkhorn-Knopp 的矩阵缩放算法计算新的距离，显著提高了性能。

Jun, 2013

使用 Sinkhorn 散度学习生成模型

本文介绍了一种使用最优输送损失的可行计算方法，通过熵平滑和自动微分来减少计算负担、提高稳定性和平滑性，获得鲁棒和可微分的最优输送损失的逼近，从而训练大规模生成模型并补充标准深度网络生成模型的计算机架构。

Jun, 2017

基于放松约束的最优输运筛选 Sinkhorn 算法

本研究提出了一种新颖的策略以有效地近似两个离散度量之间的 Sinkhorn 距离。通过直接将可忽略的双重解的组件设置为该值，我们建议通过筛选这些组件来进入 Sinkhorn 问题。这基于 Sinkhorn 分歧问题的新增双重的新公式和该问题的 KKT 最优性条件，其可从该问题中识别可筛选的双重组件，从而确保了可证明的近似。在包括规则化最优输送的复杂任务中，我们展示了 Screenkhorn 的效率，例如维数约简和领域适应。

Jun, 2019

基于 Nystrom 方法的高度可扩展 Sinkhorn 距离

本文介绍了一种新的计算 Sinkhorn 距离的方法，该方法结合了 Nyström 方法和 Sinkhorn Scaling，具有显著的计算效率，适用于海量数据。

Dec, 2018

在线压缩 Sinkhorn

使用最优传输距离（OT）和尤其是熵正则化 OT 距离作为机器学习和数据科学中的一种评估度量越来越普遍。本研究主要针对在线 Sinkhorn 算法进行改进和优化，提出了改进的收敛性分析和压缩技术结合的在线 Sinkhorn 算法，通过实证实验和理论证明验证了方法的有效性和性能。

Oct, 2023

似曾相识度量是最优传输距离，并且可以高效计算

我们提出了一种新的框架，用于在马尔科夫链之间制定最佳输运距离的形式化。我们将此问题转化为在约化空间中求解线性规划的问题，并且通过 Sinkhorn Value Iteration 方法计算最佳输运距离，从而得到与马尔科夫链的 bisimulation metrics 完全匹配的结果。

Jun, 2024

利用 Sinkhorn 散度训练差分隐私生成模型

利用差分隐私训练基于最优输运的生成模型，避免了隐私数据的直接使用，并可有效控制偏差 - 方差交换，此方法能够在多个图像建模基准测试中改进现有技术并合成 RGB 图像。

Nov, 2021