- 评估波兰文文本排序模型的泛化能力
在本研究中,我们关注波兰语的 reranking 问题,通过对 rerankers 的性能进行评估,并将结果与现有的 retrieval models 进行比较。实验证明,大多数模型在领域外的泛化上遇到了困难,然而,通过有效的优化方法和大规 - 用于重新排序推荐的非自回归生成模型
在多阶段推荐系统中,重新排名通过建模项之间的内部列表相关性发挥着关键作用。在重新排名中的关键挑战在于在排列组合空间中探索最优序列。最近的研究提出了一个生成器 - 评估器学习范式,其中生成器生成多个可行序列,评估器基于估计的列表得分选择出最佳 - WWW搜索和检索增强生成的列表感知重排序 - 截断联合模型
我们提出了一个联合模型(GenRT),通过生成式编码 - 解码结构将重新排序和截断这两个任务同时进行,从而解决了信息检索中重新排序和截断任务之间的问题。实验证明,我们的方法在网络搜索和检索增强的大语言模型上的重新排序和截断任务均达到了最佳表 - 大规模语言模型的零射击跨语言再排序用于低资源语言
研究表明,大型语言模型在各种文档重新排序任务中展现了令人印象深刻的零样本能力。本研究探讨了大型语言模型在非洲语言的跨语言信息检索系统中的重新排序效果,研究结果显示,跨语言重新排序的效果可能与语言模型的多语言能力相关,且在英语中重新排序仍然最 - RankVicuna:零样本列表式文档重排序与开源大型语言模型
我们介绍了 RankVicuna,它是第一个完全开源的大型语言模型,能够在零样本情况下进行高质量的列表排序。在 TREC 2019 和 2020 深度学习跟踪的实验结果显示,我们可以使用比 GPT-3.5 小得多的 7B 参数模型达到与零样 - ICCV全球特征对于图像检索和重排是必需的
通过利用全局特征实现精确且轻量级的图像检索,本研究提出了一种名为 SuperGlobal 的图像检索范式,通过精细的再排序阶段来提高性能,并在标准基准测试中取得了显著的改进。
- 引文作为查询:使用语言模型作为重新排序器进行来源归属
本文研究了定位文本写作所使用的源头的新方法,对多种语言模型进行微调以重新排列候选源。
- ACL高效编码格子用于重排
本文探讨了一种名为 EEL 的方法,使用 Transformers 对生成的输出的网状结构进行编码,结合新型的分词因素的迭代筛选算法 TFR,实现对 “下游指标” 进行重新排序的多文本生成任务模型的优化。通过实证研究,该算法的速度相对于传统 - 面向长篇法律意见书的论点感知抽象摘要及其摘要重排技术
提出了一种考虑文档的论证结构进行长篇法律意见的抽象概述的简单方法,其中使用论点角色信息生成多个候选摘要,并基于与文档的论证结构的对齐重新排序这些候选项。证明了该方法在长篇法律意见数据集上的有效性,并表现优于一些强基线。
- ACL三元组检索的图式推理问答
提出了一种简单而有效的方法来检索和重新排序与问题回答相关的三元组,并将它们与问题连接以提高语言模型的表现,实验结果显示,其在常识问答和开放式书本问答数据集上均表现优于现有的最佳方法。
- ACL扩展,重新排名和检索:针对开放领域问答的查询重新排名
EAR 是一种用于改进段落检索的查询扩展和重新排序方法,适用于开放领域问答。 通过将更好的查询扩展模型与检索器更好地连接起来,EAR 显着增强了传统的稀疏检索方法 BM25。
- ACL混合协同检索结果重排
提出一种混合协作的篇章重排序方法,利用上游检索器的相似度测量结果进行篇章重排序,并结合了稀疏和密集检索器的词汇和语义特征,以提高传统检索和重排序方法的性能。
- 代码生成的编码器评审重新排名
通过添加 Reviewer 模型来限制生成代码的多样性并对生成结果进行评估,从而改善了常见的代码生成算法中对退化方案的倾向,实验结果表明,这种算法实现简单且泛化性强,有望在某些情况下取代最小贝叶斯风险方法。
- 针对端到端任务导向对话系统的重新排序过度生成的回应
本研究提出了一种简单而有效的重排序方法,以从系统最初生成的响应列表中选择高质量响应,通过使用任何序列级(相似性)得分函数将响应的语义空间划分为高得分和低得分分区,并在训练时使用,用于提高末端任务导向对话系统的性能,以及在 MultiWOZ - 文本转 SQL 系统的 N-Best 假设重新排序
该研究使用预训练语言模型和约束解码技术,通过重新排序和重新解析的方式来改进 Text-to-SQL 任务的查询准确性,最终在任务中达到了最高准确率,并提出了查询计划生成方案的启发式模式。
- 使用预训练转换器的连续主动学习
研究探讨使用基于 transformer 的模型如何提升高召回率信息检索的搜索性能,提出了可基于相关反馈进行持续 fine-tune 的 CALBERT 模型。
- 知识库问答中的查询图重新排名方法
本文提出了一种新的重排方法,以更好地选择知识图谱的子图查询图形,以检索知识库问答(KBQA)中的输入问题的答案。
- ACLRefSum: 神经摘要重构
研究采用 Refactor 模型提出了一种新的文本摘要和摘要组合的统一框架,实现了在不同应用场景中的综合评估,并显着提高了在 CNN / DailyMail 数据集上的性能表现。
- GRN: 面向上下文的推荐生成重排网络
本文提出了一种新的上下文感知再排序框架 —— 生成再排序网络(GRN),包括一个基于 Bi-LSTM 和自注意力机制的评估器和一个带有 GRU、注意力机制和指针网络的生成器,通过交叉熵损失和策略梯度来优化,实验结果表明,GRN 在推荐任务中 - 深度检索:学习大规模推荐系统的可检索结构
本文中介绍了 Deep Retrieval (DR) 算法,通过学习可检索结构来获取最优推荐结果,其编码所有候选项入离散潜在空间,接着使用当前模型下的光束搜索来检索前置候选项,以实现重新排名。实验证明,使用 DR 算法,在两个公共数据集上能