Apr, 2019

使用文本分类的伪相关反馈:最简单的可行之事

TL;DR本文提出了一种基于文档相关性分类器的技术,使用来自经过排序的初始列表的伪标签,然后将分类器应用于重新排列检索到的文档,以解决伪相关反馈的问题。该技术可以显著提高多个新闻集合的结果,包括使用词袋模型 BM25 以及精调查询扩展模型。