ICMLMay, 2021

重新评估词移距离

TL;DR本文讨论了词移距离(WMD)及其与传统基线方法如词袋(BOW)和 TF-IDF 的比较,指出若使用正确的预处理方法,即 L1 正则化,则传统基线方法与 WMD 具有相近的性能,同时发现 WMD 与 L1 正则化 BOW 之间存在类比关系。