Aug, 2016

弥合差距:有效映射PubMed查询与文档的语义相似度度量

TL;DR提出了一种基于Word Mover's Distance计算单词间距离的查询-文档相似度测量方法,利用神经词嵌入在检索无直接匹配的情况下发现相关词,并将其与BM25相结合,结果在TREC Genomics数据上平均精度平均提高12%,在来自PubMed搜索日志的真实数据集上,结合学习排序的方法,正确率提高了25%,表明该方法与BM25的结合可以产生更出色的性能。