- 自监督图神经网络用于机械 CAD 检索
提出了一种基于图神经网络的自监督对比学习方法,用于机械 CAD 检索,可以直接建模参数化 CAD 原始文件,提高检索准确性和效率。
- STaRK: 在文本和关系知识库上评估 LLM 检索的基准
回答真实世界中的用户查询,如产品搜索,通常需要从半结构化知识库或涉及混合结构化和非结构化信息的数据库中准确检索信息。我们开发了 STARK,一个基于文本和关系知识库的大规模半结构化检索基准,以填补此间隙,并验证了此基准的质量和实际应用的多样 - 大型语言模型对无关输入的响应会如何被扭曲?
通过检索外部知识数据库,大语言模型在许多知识密集型任务中展示出增强的能力。然而,由于当前检索系统的固有缺陷,存在于排名靠前段落中的信息可能是不相关的。本文全面研究了 LLMs 对不同类型不相关信息在各种条件下的鲁棒性,通过构建高质量的不相关 - 基于检索演示的语言模型的上下文学习:一项调查
语言模型特别是预训练大型语言模型,在上下文少例学习方面表现出非凡的能力,能够在输入上下文中仅通过几个示例适应新任务。最近的一个发展是使用对每个输入查询量身定制的示例进行检索,这不仅提高了学习过程的效率和可伸缩性,还能减少手动示例选择中固有的 - EMNLP通过注入对抗性段落污染检索语料库
在这份研究中,我们提出了一种新的攻击方法,通过扰乱离散标记以最大限度地与提供的一组训练查询相似,从而为密集检索系统生成少量的对抗性段落。当这些对抗性段落插入到大规模的检索语料库中时,我们证明这种攻击在欺骗这些系统在攻击者未见过的查询中进行检 - ACLQUEST:一种具有隐式集合操作的实体检索查询数据集
使用维基百科分类名,我们半自动构建了一个包含 3357 个自然语言查询的 QUEST 数据集,并用于挑战现代检索系统对于含有隐式集合操作的查询的应对能力,发现包含否定和连接的查询尤其具有挑战性。
- 公平排名:一篇批判性综述、挑战和未来方向
对在线平台中对个人、提供方或内容进行公正排序的 “公正排名” 研究文献进行了批判性概述,提出了更全面和以影响为导向的公正排名研究议程的前景,包括其他领域的方法论教训以及更广泛利益相关者社区在克服数据瓶颈和设计有效监管环境方面的作用。
- 评估实体消歧和流行度在检索导向的自然语言处理中的作用
为了评估检索器的实体消歧能力,我们提出了一种评估基准(AmbER)集。我们在这项研究中使用 AmbER 集为三种流行的开放域任务创建和评估检索器,并发现检索器存在受欢迎程度偏差,对于名称下不那么流行的实体的检索性能明显下降。AmbER 集显 - SIGIR分析和学习用户交互以进行搜索澄清
本文研究了在搜索引擎中使用澄清问题以揭示查询意图的用户交互,并提出了一种基于用户交互数据的学习表示澄清问题的模型,用于重新排列自动生成的澄清问题,同时在点击数据和人工标注数据上进行评估,展示了提出方法的高质量。
- TREC 2019 公平排名任务综述
该研究介绍了 TREC Fair Ranking 跟踪项目,实现了服务于不同内容提供商公平性和相关度的基准评估,发布了一个数据集,目标是要公正地呈现来自多个未知组的相关作者的重要性,重点关注能够在各种组别定义下表现出强大性能的系统的开发。
- 目标化不匹配对抗攻击:通过一朵花来检索一座塔
本文提出了有针对性的对抗攻击方法,用于深度学习图像检索系统生成一个与用户原图片毫无相似之处但可导致相似检索结果的对抗图片,用于保护用户隐私。我们还通过设计多种损失函数攻击了部分未知系统,并在标准检索基准测试中评估了攻击效果。
- 可扩展的学习非可分解目标
本研究提出了一种统一的框架,使用简单的构建块限制,允许对各种基于排名的目标进行高度可扩展的优化,并在多个实际检索问题上展示了我们方法的优势,同时在性能和精度方面显著改进了基线。