本文提出了一种上下文感知的神经排序模型,通过引入两级分层循环神经网络对查询、搜索任务进行搜索上下文表示的学习,并结合文档排序和查询建议两个伴随的检索任务来提高检索性能,并在循环状态的两个级别上引入注意力机制来识别搜索上下文和用户正在进行的搜索活动之间的可变依赖结构。通过丰富的实验比较以及深入的消融分析,证实我们所提出的方法对于建模搜索任务中隐藏的搜索上下文具有价值。
Jun, 2019
介绍了一种基于模式的方法来从数据中生成可行的见解,并通过用户反馈对见解进行排名,从而驱动增长和变革。展示了使用该技术生成的初步定性结果,并展示了它适应反馈的能力。
Jul, 2023
用于提取结构化见解的自动化方法 InsightNet 能从客户评论中生成影响力,过程中克服了当前解决方案的限制,包括已确认主题的缺乏结构,非标准方面名称和缺乏丰富的训练数据。
May, 2024
提出了一种基于自注意力机制的上下文感知神经网络模型,用于学习商品的排序分数,在训练和推理阶段都考虑了列表中其他商品的交互作用,相较于多层感知机模型,取得了显著的性能提升,在排序学习基准 MSLR-WEB30K 上实现了新的最佳结果。
May, 2020
本文介绍了一种使用自注意力神经网络对维基百科等自然语言语料库中提取的文档进行语义排名的方法,并提出了一种模型,该模型使用了这种语义排名,能够在两个最流行的答题排行榜中名列第一,这两个排行榜分别是 ARC Easy 和 Challenge,我们还发布了排名的文档,以便它们可以被直接使用用于改进下游决策模型。
Sep, 2019
本文通过研究表格自然语言推理问题,针对文本的预训练上下文嵌入等现代自然语言处理方法在表格信息方面所面临的独特挑战,提出了有效的信息呈现改进,经过系统实验表明这些方法可以大幅提高模型的表格推理性能。
Apr, 2021
本研究旨在解决自然语言处理中未结构化文本与半结构化表之间的关系问题,通过提出基于内容的表的检索方法,应用精心设计的特征和神经网络结构实现查找中最相关表格的目标,并发布了一个包含 21,113 个网络查询和 273,816 个表格的开放领域数据集,验证了该方法的有效性并提出了该任务的挑战。
Jun, 2017
该研究论文主要讨论了信息检索中的排名模型如何应用传统启发式方法、概率方法和现代机器学习技术等技术构建,并重点介绍了基于浅层或深层神经网络的神经排名模型,分析了其基本原理和学习策略,并通过基准测试比较了这些模型,最后探讨了当前文献中存在的问题以及未来的发展方向。
Mar, 2019
本文提出了使用弱监督学习方法训练神经排序模型来解决信息检索排名问题,并通过实验结果表明,基于弱标记数据的预训练可以极大地提高神经排序模型的性能。
Apr, 2017
本文介绍了针对文本数据的关键词提取和文本摘要的处理方法,介绍了一种基于 TextRank 算法的无监督学习方法,在其基础上提高了算法的效率,并针对其忽略了不同部分的语义相似性进行了改进。此外,还开发了一种基于该框架的主题聚类算法,可单独使用或作为生成摘要的一部分来解决文本覆盖问题。
Dec, 2022