通过核心实体显著性建模实现更好的文本理解和检索

May, 2018

通过核心实体显著性建模实现更好的文本理解和检索

Towards Better Text Understanding and Retrieval through Kernel Entity Salience Modeling

Chenyan Xiong, Zhengzhong Liu, Jamie Callan, Tie-Yan Liu

TL;DR本文提出一种核实体显著性模型（KESM），通过更好地估计文档中实体的显著性（重要性），提高文本理解和检索。KESM 通过知识增强的分布式表示来表示实体，通过核函数建模实体和单词之间的交互，并结合核分数来估计实体显著性。该模型的整个过程都是通过学习实体显著性标签来完成的。显著性模型还通过模拟候选文档中查询实体的显著性，提供有效的排名特征，从而提高了即席搜索的准确性。我们在两个实体显著性语料库和两个 TREC 即席搜索数据集上的实验结果表明，KESM 比基于频率和特征的方法更为有效。我们还提供了示例，展示了 KESM 如何将其从实体显著性中学到的文本理解能力应用于搜索。

Abstract

This paper presents a kernel entity salience model (KESM) that improves text understanding and retrieval by better estimating entity salience

kernel entity salience model text understanding entity salience ad hoc search knowledge enriched distributed representations

发现论文，激发创造

利用上下文信息进行高效的实体显著性检测

在文本文档中，通过对中的有限实体进行鲜明实体识别可以在多个下游应用领域中实现重要性提取，本研究通过细调中型语言模型以交叉编码器结构取得重大性能提升，同时展示了零 - shot 指令调整语言模型在此任务上表现不佳，凸显其独特且复杂性质。

Sep, 2023

AKEM: 使用集成模型将知识库与查询对齐的实体识别和链接

该研究论文提出了一种新方法来解决 NLPCC 2015 中的实体识别和链接挑战问题，通过扩展现有知识库并利用外部知识识别候选实体，提高了召回率，同时利用支持向量回归和多增加回归树作为评分函数来过滤结果，应用规则进一步优化结果并提高精确度，该方法计算效率高，F1 得分为 0.535。

Sep, 2023

知识增强语言模型及其在无监督命名实体识别中的应用

用知识增强的语言模型（KALM）通过使用外部知识库和优化文本困惑度的端到端预测目标培训，在不需要任何其他信息（如命名实体标签）的情况下，能够成功地建模命名实体（及可能的其他类型的世界知识）并在无监督的方式上对其进行识别，并实现与最先进的监督模型相当的性能。

Apr, 2019

GUMsley：对 12 种英语流派中摘要的实体显著性评估

该研究通过提供具有显著性的实体来改善摘要生成中的实体幻觉问题，并评估了预训练的最先进的摘要模型和零 - shot LLM 提示对于捕捉生成摘要中显著实体的能力。

Jan, 2024

知识库描述中实体和文档的表示学习

本文介绍了 TextEnt，一种神经网络模型，它直接从知识库（KB）中学习实体和文档的分布式表示。通过训练我们的模型来预测文档所描述的实体并将文档和目标实体映射到连续向量空间中，其性能得到了良好的评估。

Jun, 2018

电子商务领域常识知识显著性评估的基准数据集

本文介绍了一项新的监督常识知识显著性评估任务，并发布了一个新的基准数据集。研究表明，常识知识显著性评估是一项具有挑战性的任务，我们提出了一种简单但有效的方法 - PMI-tuning，为解决这个新问题提供了希望。

May, 2022

KEPLET：具备主题实体意识的知识增强预训练语言模型

本文提出了一种新型的 KEPLMs - KEPLET，它不仅考虑了维基百科丰富的语料库结构，还具有主题实体感知。实验证明，KEPLET 应用于两种典型的 KEPLMs，在四项实体中心任务中取得了显著的改进。

May, 2023

语义实体检索工具

本文介绍了一种语义实体检索工具箱（SERT），可提供不同的表征学习算法、细粒度解析配置和与 GPU 透明化的统一接口，并可用于排列实体、提取学习的实体 / 单词表征来进行下游算法，如聚类或推荐。

Jun, 2017

异构信息网络中节点重要性价值估计的深度结构知识利用与协同

提出了一种基于异构结构知识的新型学习框架: SKES，通过运用 “具有相似特征的节点往往具有相似的重要性” 和特征嵌入距离的概念，丰富节点表征的信息性，并建立了可解释的节点重要性计算范式。在三个广泛评估的基准测试上，SKES 的性能优于几种最近的竞争方法。

Feb, 2024

从多个角度进行重要性估计的关键词提取

本文提出了一种名为 KIEMP 的新方法，该方法使用端到端多任务学习模型，从多个方面综合评估关键词的重要性，包括其句法准确性、信息显著性和概念一致性，并在六个基准数据集上验证了其优于现有技术的性能。

Oct, 2021