Mar, 2023

通过可控的查询生成提高搜索中的内容可检索性

TL;DR在线平台中重要的目标是促进内容发现,然而,机器学习搜索引擎存在较高的检索偏差,我们提出了一种生成查询的方法,旨在改善训练数据和查询分布对检索能力的负面影响。在音乐、播客和图书等领域的数据集上,使用 CtrlQGen 明显减少了密集检索模型的可检索性偏差。