ESBM: 实体概述基准
该研究提出了一个面向实体的可控摘要任务,并介绍了一个名为 EntSUM 的人工注释数据集,证明了现有的可控摘要方法无法生成实体为中心的摘要,提出了一种方法来改善此问题。
Apr, 2022
本文提出了一种名为 MPSUM 的方法来解决实体概括生成的问题,该方法使用概率主题模型并集成谓词唯一性和对象重要性的想法进行三元组排名,以生成简洁但代表性的实体概括。在使用 DBpedia 和 LinkedMDB 数据集进行对比实验后,结果表明我们的方法提高了实体概括的质量。
May, 2020
SUMIE 是一个完全合成的数据集,用于暴露现实世界的增量实体摘要挑战,验证了生成的摘要与段落之间的高质量一致性,该数据集难度高,先进的语言模型在更新摘要时的 F1 得分超过 80.4%。
Jun, 2024
本文提出了一种基于实体驱动事实感知的框架,用于训练端到端的基于 Transformer 的编码 - 解码模型以摘要生物医学文章。在使用知识库中的命名实体和事实进行指导的情况下,EFAS 能够实现比标准源文档到摘要设置更准确的实体级事实准确性、N-gram 新颖性和语义等价性,而 ROUGE 指标的表现相当。
Mar, 2022
本文提出了一种基于神经模型的监督式方法 NEST,用于在大规模知识图谱中联合编码图结构和文本,并生成高质量多样化的实体摘要,通过采用程序化标注数据进行训练,克服手动标注摘要数据的昂贵问题。研究表明,该方法在两个公共基准测试中明显优于现有技术。
May, 2020
本文研究了使用链接实体以指导神经文本摘要器生成简洁更好摘要的方法,并提出了 Entity2Topic (E2T) 方法。通过 E2T 应用于基于 Aufmerksamkeit 机制的简单序列到序列模型,在 Gigaword 和 CNN 摘要数据集上至少获得 2 个 ROUGE 点的显著性能提升。
Jun, 2018