Feb, 2020

带有最优传输的可微 Top-k 操作符

TL;DR研究了 top-k 运算在使用算法实现后无法通过梯度下降算法从端到端训练的问题,提出了基于最优输运的平滑近似 SOFT top-k operator,并在 k 最近邻居和 Beam Search 算法中应用,改善了性能。