MrRank:通过多结果排名模型提升问答检索系统
本文介绍了如何使用大型语言模型(LLMs)有效地学习使用现成的信息检索系统来回答问题时所需的附加上下文。通过在 PopQA 数据集上进行评估,我们展示了 Adapt-LLM 在使用所有问题的信息检索、仅使用 LLM 的参数存储器以及使用人气阈值来决定何时使用检索程序三种配置下,相比相同 LLM 的改进。通过我们的分析,我们证明了当 Adapt-LLM 确定无法回答问题时,它能生成 <RET> 标记,表明需要进行信息检索,同时当只依赖参数存储器时,其达到明显高的准确率水平。
Apr, 2024
信息检索领域,自传统搜索开始已经发展得非常成熟,并且扩展到满足用户不同的信息需求。最近,大型语言模型在文本理解、生成和知识推理方面表现出了异常的能力,为信息检索研究打开了令人兴奋的新方向。大型语言模型不仅有助于生成式检索,还为用户理解、模型评估和用户系统交互提供了改进的解决方案。最重要的是,信息检索模型、大型语言模型和人类之间的相互作用形成了一个更强大的信息搜索技术范式。信息检索模型提供实时和相关的信息,大型语言模型提供内部知识,而人类在信息服务的可靠性方面起到了需求者和评估者的核心角色。然而,仍然存在一些重大挑战,包括计算成本、可信度问题、特定领域限制和伦理考虑。为了深入讨论大型语言模型对信息检索研究的变革性影响,中国信息检索界于 2023 年 4 月举办了一次战略研讨会,得出了有价值的见解。本文总结了研讨会的成果,包括对信息检索核心价值的重新思考、大型语言模型和信息检索的相互增强、一个新的信息检索技术范式的提出以及面临的挑战。
Jul, 2023
基于 Large Language Models (LLMs) 的技术,通过自动化查询 - 商品对的相关性判断,改善产品搜索的相关性预测精度,对商品搜索的相关判断自动化领域具有重要影响。
Jun, 2024
信息检索技术是一个不断发展的领域,这篇论文综述了信息检索技术的演变,重点讨论大型语言模型在传统搜索方法与新兴答案检索范式之间的桥梁作用。借助 GPT-4 等大型语言模型的整合,响应检索和索引领域正在发生范式转变,从而使用户能够更直接地与信息系统进行互动并获得语境相关的回答。通过这一探索,我们希望揭示塑造这一发展历程的技术里程碑及未来可能的方向。
Feb, 2024
本文介绍了一种名为 ChatLR 的新型检索增强框架,主要利用大型语言模型(LLMs)的强大语义理解能力作为检索器,以实现精确和简洁的信息检索。通过在金融领域微调 LLM 并构建基于 LLM 的搜索和问答系统,实验证明 ChatLR 在解决用户查询中表现出高达 98.8%的信息检索准确性。
May, 2024
通过在细调阶段共同训练信息检索系统和大规模语言模型,引入了一种创新方法 —— 共同医学 LLM 和检索训练(JMLR),以克服传统模型在处理医学问答任务方面面临的挑战,通过采用同步训练机制,JMLR 降低了对计算资源的需求,增强了模型利用医学知识进行推理和回答问题的能力。我们的实验结果表明,JMLR-13B 在 Amboos 上的正确率为 81.2%,在 MedQA 上的正确率为 61.3%,优于使用传统预训练和精调 Meditron-70B 模型(在 AMBOSS 上为 76.4%,在 MedQA 上为 60.3%)。在规模相同的 7B 模型中,JMLR-7B 的正确率(在 Amboos 上为 68.7%,在 MedQA 上为 51.7%)明显优于其他公开模型(Meditron-7B:50.1%,47.9%),证明了它在成本(我们的训练时间:37 小时,传统方法:144 小时)、效率和医学问题回答任务的有效性方面的优越性。通过此工作,我们为医疗保健提供了一种新的高效知识增强工具,展示了将信息检索和大规模语言模型训练集成到精确医学信息检索和问答系统中的巨大潜力。
Feb, 2024
本文针对欧洲议会选举的数据进行建模,提出了一种基于随机森林和多层感知器神经网络相结合的方法,去完成对选民意向的预测任务,该模型相比其他模型具有更好的预测准确度和稳定性。
May, 2022