KDDAug, 2020

Sinkhorn 距离的模仿学习

TL;DR本文提出了一种将模仿学习看作是最小化占用量度量之间的 Sinkhorn 距离的可实现解决方案,并通过在对抗性学习特征空间中定义余弦距离成本,将最优运输度量的有价值特性与比较非重叠分布相结合。