ESBM: 实体概述基准

Mar, 2020

ESBM: An Entity Summarization BenchMark

Qingxia Liu, Gong Cheng, Kalpa Gunaratna, Yuzhong Qu

TL;DR本文创建了一个最大的可用基准测试方法 (ESBM)，以评估 9 个现有系统，考虑到所有这些系统都是无监督的，我们还实施和评估了一种基于监督学习的系统。该方法能够选择 RDF 数据中的子集来计算实体的最佳紧凑摘要，支持多种应用，并且已经得到了有益的研究。

Abstract

entity summarization is the problem of computing an optimal compact summary for an entity by selecting a size-constrained subset of triples from rdf data. →

entity summarization rdf data benchmarks unsupervised learning supervised learning

发现论文，激发创造

实体概述：现状和未来挑战

本文综述了实体摘要技术的最新研究进展，探讨了现有方法的技术特征和框架，同时提出了未来研究方向。

Oct, 2019

EntSUM：面向实体的摘要数据集

该研究提出了一个面向实体的可控摘要任务，并介绍了一个名为 EntSUM 的人工注释数据集，证明了现有的可控摘要方法无法生成实体为中心的摘要，提出了一种方法来改善此问题。

Apr, 2022

基于谓词匹配的实体摘要

本文提出了一种名为 MPSUM 的方法来解决实体概括生成的问题，该方法使用概率主题模型并集成谓词唯一性和对象重要性的想法进行三元组排名，以生成简洁但代表性的实体概括。在使用 DBpedia 和 LinkedMDB 数据集进行对比实验后，结果表明我们的方法提高了实体概括的质量。

May, 2020

ESA：具有注意力机制的实体摘要

本文提出了一种名为 ESA 的基于神经网络的实体概述方法，通过监督式注意力机制和 F-measure 评价，成功地应用于知识图谱上。

May, 2019

SUMIE: 增量实体摘要的合成基准

SUMIE 是一个完全合成的数据集，用于暴露现实世界的增量实体摘要挑战，验证了生成的摘要与段落之间的高质量一致性，该数据集难度高，先进的语言模型在更新摘要时的 F1 得分超过 80.4%。

Jun, 2024

生物医学文献的面向实体和事实的抽象摘要生成

本文提出了一种基于实体驱动事实感知的框架，用于训练端到端的基于 Transformer 的编码 - 解码模型以摘要生物医学文章。在使用知识库中的命名实体和事实进行指导的情况下，EFAS 能够实现比标准源文档到摘要设置更准确的实体级事实准确性、N-gram 新颖性和语义等价性，而 ROUGE 指标的表现相当。

Mar, 2022

神经实体摘要与联合编码和弱监督

本文提出了一种基于神经模型的监督式方法 NEST，用于在大规模知识图谱中联合编码图结构和文本，并生成高质量多样化的实体摘要，通过采用程序化标注数据进行训练，克服手动标注摘要数据的昂贵问题。研究表明，该方法在两个公共基准测试中明显优于现有技术。

May, 2020

神经抽象总结的实体通识表示

本文研究了使用链接实体以指导神经文本摘要器生成简洁更好摘要的方法，并提出了 Entity2Topic (E2T) 方法。通过 E2T 应用于基于 Aufmerksamkeit 机制的简单序列到序列模型，在 Gigaword 和 CNN 摘要数据集上至少获得 2 个 ROUGE 点的显著性能提升。

Jun, 2018

长文档摘要的实证调查：数据集、模型和度量

本综述论文系统性地评估了长文档自动摘要各主要组成部分的研究进展，包括基准数据集、摘要模型和评估方法，并提出未来工作的方向。

Jul, 2022

ERBench: 大型语言模型的基于实体关系的自动可验证幻觉基准

利用已有的关系数据库通过实体 - 关系模型自动构建基准测试，并能够对大型语言模型进行多样问题类型的评估分析。

Mar, 2024