- 通过自动化搜索结果验证和重新排序提高技术 “如何做” 查询的准确性
通过自动化搜索结果验证和重新排序的方法,该论文提出了改善在线技术支持搜索结果准确性和相关性的新方法。通过解释和执行搜索结果中的逐步说明,并将搜索结果成功指标整合到重新排序机制中,论文详细介绍了解决方案的架构和全面评估结果。实验结果表明,在排 - 通过贝叶斯优化改进 Azure 认知搜索的搜索相关性
提出一种新的方法来找到最佳的 Azure Cognitive Search 配置,从而提高特定用例的搜索相关性,并通过将搜索相关性问题制定为超参数调整来改善关键的在线市场指标。
- EMNLP代码搜索去偏技术:提升搜索结果的整体排名性能之外的表现
通过分析代码搜索模型的偏差,本论文研究了代码搜索引擎的另一方面,提出了一种基于重排序的去偏方法,能够有效减少代码搜索引擎的偏见并提高整体排名性能。
- 在线表示很重要:搜索和推荐系统中的实用端到端多样化
为了在在线平台中提高用户的代表性,我们提出了一种端到端的多样化机制,包括检索、排名和负责平衡多样性和实用性的多目标优化;实验结果表明这种方法显著提高了多样性,并且在实用性方面具有中性到正面的影响。
- 新闻文章中的政治偏见量化
本文旨在建立一种自动模型,评估在线新闻文章的意识形态偏见,结果表明目前的自动模型能力不足以被用于自动注释文档,进而计算搜索结果中的偏见。
- KDD提升电子商务搜索结果的几点实践
本研究旨在通过应用自然语言处理方法来提高搜索结果的质量,从而显著增强电子商务搜索引擎的用户体验和参与度。我们在 Amazon KDD Cup 2022 中排名第一、第二和第三,讨论了我们的实用解决方案,可在此 https URL 获取代码。
- KDDMondegreen:一种针对语音搜索查询的语音识别错误后处理解决方案
本文介绍了一种名为 Mondegreen 的方法,它可以在没有声音信号的情况下,通过对用户的语音查询在文本空间中进行更正,以解决自动语音识别引入的误差导致的不相关搜索结果问题,并且已经在 Google 等公司的搜索系统中得到了显著的改善。
- SIGIR在线学习排序的梯度空间有效探索
本文介绍了一种名为 Null Space Gradient Descent 的算法,该算法通过高效地在梯度空间中进行探索,加快了在线学习排序(OL2R)算法的学习过程,并改进了交错测试的敏感性。 在公共基准测试中,与现有 OL2R 算法进行 - WSDMCo-PACRR:面向上下文的神经信息检索模型
本文提出以往基于神经网络的信息检索模型忽略了上下文信息,从而会存在三个问题。作者提出了三个解决方案并开发了 Co-PACRR 模型,相较于其他模型有更好的检索结果。
- 点击反馈的伯努利一级臂老虎机
该研究提出了基于位置的模型来解释用户点击搜索结果的概率,并提出了 Bernoulli rank-1 bandit 和 Rank1ElimKL 算法来解决排名问题。该算法在不同条件下的实验表现证实其较简单的对手策略更加优秀。