一种简单的重要性自动摘要理论模型

ACLJan, 2018

一种简单的重要性自动摘要理论模型

A Simple Theoretical Model of Importance for Summarization

Maxime Peyrard

TL;DR本文提出了纪录片概述任务的理论模型，并根据其提出了实用的概念框架，包括关键词的重复性，相关性和信息量，这些概念统一为 ' 重要性 '。实验证明这个框架有潜力提高纪录片概述系统的性能。

Abstract

Research on summarization has mainly been driven by empirical approaches, crafting systems to perform well on standard datasets with the notion of information importance remaining latent. We argue that establishi

summarization importance redundancy relevance informativeness

发现论文，激发创造

长文档摘要的实证调查：数据集、模型和度量

本综述论文系统性地评估了长文档自动摘要各主要组成部分的研究进展，包括基准数据集、摘要模型和评估方法，并提出未来工作的方向。

Jul, 2022

使用针对语义任务训练的模型评估词汇重要性

本研究提出一种基于自然语言推理和释义识别的模型训练方法，通过解释预测模型的预测结果，得到每个输入标记的重要性分数，并可以分析其语法特征，可用于识别训练中没有明确标记的句子中的重要单词。

May, 2023

KLearn: 从总结数据中推断出背景知识

本文研究了文本摘要中的背景知识，提出了一种技术来推断摘要数据中的背景知识，设计了能够明确建模背景知识的摘要评分函数，并证明这些函数显著地适合人类判断。

Oct, 2020

ROUGE-K：您的摘要是否含有关键词？

我们提出了一种关键词取向的评估指标 ——ROUGE-K，该指标通过定量回答 “摘要中是否包含关键词” 这个问题来评估自动摘要模型是否包含有信息性的单词。通过这种关键词感知的度量方法，我们令人惊讶地发现，当前的一个强基准模型在摘要中常常会遗漏重要信息。我们的分析揭示了人工注释者确实认为包含更多关键词的摘要与源文档更相关。最后，为了增加关键词的包含，我们提出了四种将词重要性融入基于变换器的模型的方法，并通过实验证明这样做可以在保持总体质量的同时引导模型包含更多关键词。

Mar, 2024

单文档新闻摘要中的（非）重要内容检测

本研究提出了一种鲁棒的方法，通过训练文档 - 摘要配对的语料库来检测新闻中内在句子的重要性，并结合‘文档开头’启发式方法，用于单篇文档摘要，得到了比现有先进摘要算法和基线方法更好的结果，这是一个重要的进步。

Feb, 2017

早并不总是更好：自动摘要中文本和系统偏见的子方面分析

对于神经摘要系统的明显改进及其依赖的语料库的基础逻辑尚未得到广泛探讨，因此本文提出了摘要的三个子方面：位置、重要性和多样性，并针对九个不同的摘要语料库（例如新闻、学术论文、会议纪要、电影剧本和书籍）进行了广泛分析。研究发现，尽管位置在新闻报道中存在重大偏见，但在学术论文和会议纪要等其他领域不是这种情况。此外，我们的经验证明不同类型的自动摘要系统（例如基于神经网络）由不同程度的子方面组成。因此，本研究提供了有关在收集新的摘要数据集或开发新系统时考虑基础子方面的有用信息。

Aug, 2019

从多个角度进行重要性估计的关键词提取

本文提出了一种名为 KIEMP 的新方法，该方法使用端到端多任务学习模型，从多个方面综合评估关键词的重要性，包括其句法准确性、信息显著性和概念一致性，并在六个基准数据集上验证了其优于现有技术的性能。

Oct, 2021

自动文本摘要方法：综述

本文详细介绍了文本摘要的各种方法，包括提取和抽象两种途径，评估指标、基准数据集与未来的研究展望，并讨论了生成摘要的不同评估方法与相关研究中可能出现的挑战和研究机遇。

Mar, 2022

对于下游任务，摘要是否有用？人类外在评估对文本摘要的研究

该论文研究了自动文本摘要技术，提出了外部方法来评估文本摘要的实用性，并设计了三种不同的任务，发现细化模型生成的文摘在整体评价型任务中尤为有用。在人工评估和自动评估指标之间也存在一定的限制性。

May, 2023

特征重要性的固有不一致性

本文提出一种新的特征重要性得分框架，通过将特征空间重新划分成可分离集合，从而统一了现有研究所存在的不一致性，实现了对机器学习算法的可解释性。

Jun, 2022