SIGIRJan, 2020

编辑距离的卷积嵌入

TL;DR本文提出了一种基于深度学习的 CNN-ED 管道,将编辑距离嵌入欧几里得距离以进行快速近似相似度搜索来优化字符串相似度搜索。实验结果表明,与数据无关的 CGK 嵌入和基于 RNN 的 GRU 嵌入相比,基于 CNN 的嵌入在准确性和效率方面都优于前者,有时效率提高了若干个数量级。