该论文介绍了基于大规模文本检索技术在实际商业场景中的应用,以及在 TREC 2022 深度学习竞赛中所采用的混合文本检索和多阶段文本排序方法,结果表明我们提出的方法有效。
Aug, 2023
本文介绍了使用 Transformer-Kernel 模型进行文档重排序的方法,并通过 TREC 2019 深度学习赛道的评价来表明其有效性。
Dec, 2019
今年是 TREC 产品搜索跟踪的第一年。重点在于创建可重复使用集合,并评估元数据和多模态数据对检索准确性的影响。研究结果显示,在产品搜索领域,传统的检索系统效果非常好,通常优于通用的预训练嵌入模型。我们还评估了使用简化和元数据增强集合的影响,发现扩展集合的影响没有明显的趋势。我们还观察到一些令人惊讶的结果,尽管单阶段密集检索运行在其他任务上表现出色且被广泛采用,但在零 - shot 和精细调整领域中,常常不具竞争力或生成低质量结果。
Nov, 2023
本文基于 Guo 等人 (2016) 的深度相关匹配模型 (DRMM),探讨了几种新的文件相关性排序模型。加入上下文有关的编码,包括多视图的查询和文档输入,测试证明新模型优于 BM25,DRMM 和 PACRR。
Sep, 2018
本文介绍了一种基于文档重排序的方法,结合神经查询 - 文档匹配和文本摘要技术,用于信息检索和精准医疗中多方面的搜索问题,并在 NIST TREC-PM 轨迹数据集上取得了最新的表现。
Dec, 2020
TREC 2019 新推出的 Deep Learning Track 使用大量标注数据,对包含三百万文档和五十万训练查询的 Ad Hoc 排名展开研究,结果 Deep Learning 方法在 15 组提交的 75 个运行中取得了优异的表现。
Mar, 2020
该研究介绍了 TREC Fair Ranking 跟踪项目,实现了服务于不同内容提供商公平性和相关度的基准评估,发布了一个数据集,目标是要公正地呈现来自多个未知组的相关作者的重要性,重点关注能够在各种组别定义下表现出强大性能的系统的开发。
本研究探讨了基于伪相关反馈的多重嵌入密集检索方法的潜力。通过从第一遍密集检索中确定的伪相关文件集中提取代表性反馈嵌入,然后将其添加到查询表示中,证明了这些附加反馈嵌入不仅能够提高重新排序的有效性,还能提高附加密集检索操作的效率。
Jun, 2021
多伦多大都市大学参与 TREC 临床试验领域 2023 年的研究,在实验中利用先进的自然语言处理技术和神经语言模型,检索相关性最高的临床试验,并展示了整体的方法论、实验设置和结果。
Mar, 2024
使用自然语言处理技术,研究医学技术中临床试验的主题匹配问题,并提出不同的 NLP 方法,成功地生成了相关的临床试验名单,并取得了显著的研究成果,但仍有改进空间。
Feb, 2022