- ACLHybriDialogue: 一个基于表格和文本数据的信息查询对话数据集
本篇论文提出一个基于维基百科文本和表格的 HybriDialogue 数据集,通过将复杂的多跳问题分解为简单的、现实的多轮对话,创建了众包自然语言对话。针对该数据集,我们提出了检索、系统状态跟踪和对话响应生成任务,并进行了基线实验。实验结果 - 寻求知识的语言模型:对话和提示补全的模块化搜索与生成
本研究采用搜索引擎、知识生成,以及生成最终回复的单一语言模型 SeeKeR,来取代先前的隐式检索式方法,实现了开放域知识驱动的对话,以及在话题提示补全方面的表现优于 GPT2 和 GPT3。
- 高效即时搜索的深度强化学习智能体
本研究提出了一种基于强化学习的方法来解决实时搜索中高负载问题,并通过评估框架验证了其在搜索效果和性能上的优越性。
- 多跳知识库问答的子图检索增强模型
本研究提出了一种可训练的子图检索器(SR),它与后续的推理过程分离,可增强任何以子图为导向的 KBQA 模型,并通过弱监督的预训练以及端到端的微调,与 NSM 组合成为新的基于嵌入的 KBQA 方法的最新的最先进的表现。
- AAAI学习时间点过程用于连续时间事件序列的高效检索
我们提出了 NEUROSEQRET,它可以学习检索和排名相关连续时间事件序列的集合,以解决连续时间事件序列的检索问题,并使用 MTPP 引导神经相关模型,以及使用二元序列嵌入的优化框架来进行哈希,从而获得显着的速度优化。
- Uni-Retriever: 在 Bing 赞助搜索中学习统一嵌入式检索器
本文提出了一种新的框架 Uni-Retriever,通过知识蒸馏和对比学习的方式,联合进行高相关性和高 CTR 检索的多目标学习过程,以生成嵌入式向量进行嵌入式检索,该检索方式可以实现广告检索的两个目标。经多项测试验证,该方法显著提高了 B - 食品评论和推荐的机器学习
使用深度学习方法构建了一个基于 Web 的美食点评系统, 实现了对美食点评的情感分析、自动标签生成和检索。结果表明,这对解决实际问题具有很高的应用前景。
- ICCV通过视觉概念进行任务感知的集成学习和迁移学习,赢得 ICCV'2021 VALUE 挑战
本技术报告介绍了我们在 VALUE 挑战赛中的优胜策略:单一模型优化,使用视觉概念的迁移学习以及任务感知的集成。根据我们的方法,我们在比赛的 VALUE 和 QA 阶段中排名第一。
- CVPR使用大批次和相似度混合的 Top-k 替代损失
通过发掘新的损失函数、批大小和新的正则化方法之间的相互作用来学习用于检索的深度视觉表示模型。提出了一种可微的代理损失作为召回的替代,使用一个实现操作在成对标量相似度上的有效的混合正则化方法,以训练具有极高批大小的模型。该方法在多个图像检索基 - 跨语言密集文段检索的多语言问答模型
本研究提出 Cross-lingual Open-Retrieval Answer Generation (CORA) 模型,它是第一个可以回答跨多种语言问题的问答模型,利用密集型检索算法,与多语言自回归生成模型相结合,即可实现直接在目标语 - KDD百度搜索中用于 Web 规模检索的预训练语言模型
本文描述了一种使用最新的中文预训练语言模型 ERNIE 开发和部署检索系统的方法,并通过离线和在线实验表明该系统性能良好,特别是对于那些查询需求不常见的查询,该检索系统可以大大提高搜索引擎的易用性和适用性。
- 使用更强数据增强进行对比学习
该研究提出了一种名为 Contrastive Learning with Stronger Augmentations(CLSA)的新的对比学习方法,利用数据扩增引入样本多样性,从而提高检索能力,实验结果表明该方法在 ImageNet 数据 - SIGIR从语义检索到成对排名:在电子商务搜索中应用深度学习
本文介绍了如何将深度学习模型应用到电商平台搜索系统的重要阶段之一 - 商品检索和排名中,以提高语义检索和个性化排名的效果。
- ACL基于密集检索的表格开放领域问答
本研究针对开放领域问题回答系统的表格数据提出了一种有效的检索方法,并通过训练和挖掘难例等技术,提高了回答的准确性和表现。
- ACL搜索 COVID-19 问题的科学文献
探讨如何为新疾病的大流行提供可靠的信息支持,实现新的信息检索,采用不同的排名算法,并提出了神经检索方法,并在 TREC COVID 搜索中证明其有效性。
- SIGIR开放式检索对话式问答
本文提出一种名为 ORConvQA 的交互式检索问答方法,通过基于 Transformers 的检索器、排序器和阅读器,实现在大规模语料库中检索答案并提取答案以构建功能性的交互式检索系统,并创建了 OR-QuAC 数据集以促进 ORConv - SIGIR通过多任务学习实现规模化的高效图像库表示
通过多任务学习的方法构建通用的图片库编码器,并证明它是实现学习表示在新的下游任务中通用性的实用方法。此外,我们分析了 MTL 训练解决方案相对预测性能与最优解决方案的差异,并发现 MTL 是一种有用的机制来解决低资源二元任务中的稀疏性信号。
- SIGIR对长文本进行的本地自注意力机制以提高文档检索效率
本文提出了一种局部自注意力机制,用于解决检索过程中考虑前 n 个单词导致系统检索长文档时出现偏差的问题,并在 TREC 2019 深度学习排行榜任务上取得了显著的检索质量提升。
- ICLR最小化 FLOPs 来学习高效稀疏表示
提出了一种基于正则化函数的方法,学习高维稀疏表示,以在视觉检索中提高效率,其表现与其他基线方法相竞争,且在实际数据集中具有类似或更好的速度精度平衡。
- 紧凑深度汇聚用于集合检索
该研究旨在学习一种紧凑的嵌入方式,该嵌入方式适用于有效的检索和排序,同时保持各个描述符的可辨别性。作者提出了一种基于 CNN 网络的框架(SetNet),以实现该目标,并展示了它在人脸图像的检索上具有很好的效果。