- 数据库增强的信息检索查询表示
利用关系数据库中的元数据和图形集编码策略,我们提出了一种改进了查询性能的检索框架,用于扩展查询并增强信息检索模型。
- 灵活的深度神经网络在执法机构中用于确定:何处、何人和何物的图像分析
由于对有效安全措施的需求增加以及摄像头在商业产品中的集成,今天产生了大量的视觉数据。执法机构正在检查图像和视频,以查找激进化、恐怖组织的宣传和暗网市场上的非法产品。本文通过深度卷积神经网络(CNN)的视觉概念检测来理解图像内容,并提出了五个 - 科学审校 Reloaded: 透明度与逻辑推理的双向模式
通过两个步骤解决科学信息检索中的限制,第一个步骤使用查询扩展来加强稀疏检索的语言理解,第二个步骤通过仅利用长文档中的信息来提供综合和信息丰富的答案,实现双向参与,进而在透明性、逻辑思维和综合理解方面带来显著的进展。
- Web 搜索中的事件驱动实时检索
本文研究信息检索在实时搜索中面临的挑战,通过整合事件信息和查询,利用跨注意力机制实现时间背景的查询表示,通过多任务训练增强事件表示能力,以及通过两阶段训练和硬负采样进行模型优化,并通过实验证明本方法在时间敏感场景下显著优于现有基线方法。
- 生成、过滤和融合:零样本神经排序器的多步关键词扩展
查询扩展对于复杂的现代交叉编码器排名器的影响尚未得到充分探索,本研究提出了 GFF 管道,通过生成、过滤和融合查询扩展更有效地改善零样本排名指标,进而改进了 BEIR 和 TREC DL 2019/2020 上的零样本 nDCG@10。
- MILL:零 - shot 查询扩展的大语言模型相互验证
本研究提出了一种基于大型语言模型的互相验证框架,用于查询扩展,通过检索和生成的文件相互补充来改善查询扩展的效果,并在三个信息检索数据集上进行了大量实验证实,结果显示我们的方法明显优于其他对照组。
- 生成查询和文档扩展何时失败?跨方法、检索器和数据集的综合研究
使用大型语言模型进行查询或文档扩展可以提高信息检索的泛化能力,但是否普遍有益或仅在特定环境下有效仍不清楚。本研究通过第一次全面分析基于语言模型的扩展,发现存在查找模型表现与扩展收益之间的强负相关性。我们的结果建议:对于较弱的模型或目标数据集 - ChatGPT 模型在生物医学任务中的零样本性能探究
本文评估了商业 Large Language Models (LLMs) GPT-3.5-Turbo 和 GPT-4 在 2023 BioASQ 挑战的任务中的表现,其中 0-shot learning 和相关段落达到了竞争水平。
- KDD学习在对话式搜索中与先前交谈内容的关联
本文提出了一种新的方法来选择与当前查询相关且有用的历史查询,采用伪标记法进行注释,结合多任务学习框架并在微调过程中进行选取模型和检索模型联合训练,提高对话式搜索中检索效果。
- ACL网络搜索中基于事件的查询扩展
本文提出了一种新的查询扩展系统 Event-Centric Query Expansion(EQE),通过从大量的潜在事件中挖掘最佳扩展,快速准确地提高搜索质量,该系统已被部署在腾讯 QQ 浏览器搜索中,服务于数亿用户。
- ACL扩展,重新排名和检索:针对开放领域问答的查询重新排名
EAR 是一种用于改进段落检索的查询扩展和重新排序方法,适用于开放领域问答。 通过将更好的查询扩展模型与检索器更好地连接起来,EAR 显着增强了传统的稀疏检索方法 BM25。
- Query2doc: 大语言模型的查询扩展
该研究提出了一种称为 query2doc 的简单而有效的查询扩展方法,通过利用大型语言模型生成伪文档并将其扩展到查询中,从而提高了信息检索系统在 ad-hoc IR 数据集上的性能,如 MS-MARCO 和 TREC DL。
- 基于生成模型的查询扩展技术在代码检索中的应用
本文提出了一个以生成扩展查询为基础的框架,利用强大的代码生成模型来提高代码检索任务。该方法优化了嵌入到潜空间的文档 - 代码对,利用生成的代码片段将文档查询扩展与目标代码片段匹配。该方法在 CodeSearchNet 数据集上实验,并取得了 - 利用语言模型的语境线索采样进行查询扩展
本文提出了一种结合了有效过滤策略和基于上下文生成概率的检索文档融合的词汇匹配的方法,在减小索引大小的同时,提高了检索准确性;同时,在 end-to-end QA 模型中,该方法也能取得最高的 Exact-Match 分数。
- 语音助手系统中的查询扩展和实体加权查询重构检索
本文提出了一种新的查询扩展和实体加权方法,利用实体目录中的实体关系改进查询重构性能,实验发现该方法相比不使用查询扩展和加权的基准模型,特别是在前 10 个结果中,精度有 6% 的提高,在使用查询扩展和加权的其他基准模型中,精度有 5% 以上 - 知识图谱嵌入及其应用调查
该论文介绍了知识图谱嵌入在推荐系统、查询扩展和实体嵌入等领域的应用,并探讨了包括基于结构信息、文本信息和图像信息的 KG 嵌入模型。
- WSDM事件驱动的查询扩展
本文研究了基于事件的查询扩展技术,利用新颖的词语和事件的嵌入机制在相同的向量空间中识别查询和事件之间的语义关系,进而在多个新闻文本检索数据集上显著提高检索性能。
- EMNLPBERT-QE: 基于上下文的查询扩展用于文档重新排名
本论文提供了一种使用 BERT 模型选择相关文档块进行扩展的新型查询扩展模型,能够在标准 TREC Robust04 测试集上显著优于 BERT-Large 模型,有助于解决查询扩展方法引入不相关信息的问题。
- ECCV基于注意力机制的查询扩展学习
提出一种基于自我注意力机制的模型,以更高的准确性进行查询扩展,克服现有方法的缺陷。
- AAAI使用词嵌入和专业众包技术进行专利搜索的查询扩展
本文在 11 个不同的技术领域研究了词嵌入和众包模型的有效性,重点是专利、查询扩展、词嵌入、相关术语和众包模型。