- 重新审视自动摘要评估指标的系统层面相关性
本文探讨了自动文摘评估指标能够准确复制人类总结质量判断的可靠性,并提出了对现有评估体系的变更,以改善两个方面的偏差,这两个方面分别是评估指标使用的方法与实际评估系统的方式不一致,以及通过只计算小得分差距的系统之间的相关性来计算相关性。通过此 - 神经抽象摘要方法调查及其摘要的事实一致性
自动摘要是计算机缩短文本数据的过程,以创建一个表示原始文本中最重要的信息的子集 (摘要)。现有的摘要方法大致可以分为两类:抽取式和生成式,前者会从源文档中显式选择文本片段 (单词,短语,句子等) ,而后者则会生成新的文本片段来传达源文件中最 - 将领域知识整合到法律案例提取式摘要中
提出了一种基于领域知识的无监督算法 DELSumm 来实现自动化法律文书摘要,该算法在印度最高法院的案例文件上的实验表明,该算法在 ROUGE 分数方面优于多个强基线,包括基于通用算法和专业法律算法,尽管该算法没有监督学习,但胜过了多个训练 - ACL跨语言文本摘要评估的有效性评估
本文旨在系统评估英语汇总评估方法在其他语言下的效力,并通过对八种不同语言的汇总语料库进行人工注释和 19 种汇总评估指标的评估,发现使用多语言 BERT 作为 BERTScore 的评估方法在所有语言下均表现出良好的效果,超过了英文水平。
- 评估咨询记录的后编辑初步研究
该研究提出了一种半自动化的方法来解决自动摘要难以在临床环境中使用并且难以评估安全性的问题,该方法利用医师编辑自动生成的笔记以提高其效率和安全性。该研究通过模拟会诊评估了这种方法的时间效益,在这个实验中,半自动方法比从头开始写笔记更快。
- 消费者健康问题答案的问题驱动摘要
本研究提供了一个包含消费者健康问题答案的问答驱动摘要集 MEDIQA Answer Summarization dataset,可用于评估抽取式或抽象式算法生成的单个或多个文档,展示了基线和最新深度学习总结模型的结果,并推动医学问题回答中的 - 提高抽象摘要的事实一致性
文章提出了一种基于事实感知的自动摘要模型 FASum,通过图注意力来提取和整合摘要生成过程中的事实关系,并设计了一个名为 FC 的事实校正模型来自动纠正现有系统生成摘要中的事实错误。实证结果表明,基于事实感知的自动摘要可以生成具有更高事实一 - WWW生成新闻故事的代表性标题
试图在不使用人工标注的情况下通过在不同级别上同时使用多个类型的未标注语料库和自投票方法对新闻报道进行标题生成的研究。
- COLING利用评论摘要进行情感分析的最佳实践
本文旨在利用摘要信息实现评论情感分析,探讨不同交互方式并提出一个分类器,结果表明该分类器能更好地利用用户撰写的摘要进行评论情感分析,并且在使用自动摘要系统生成摘要时比现有方法更有效。
- BillSum:美国立法的自动摘要语料库
本文针对美国国会和加州州政府发布的众多议案进行了研究,推出了第一个用于议案自动摘要的数据集 -- BillSum。文章介绍了该数据集的属性,对比了不同的提取方法,并证明了基于国会议案的模型能够应用于对加州议案的自动摘要。
- ACL作为自动评估指标的问答系统在新闻文章摘要中的应用
本研究提出新的评估指标 Answering Performance for Evaluation of Summaries (APES),结合阅读理解领域的进展,通过对中心实体进行手动创建问题的回答能力来评估文章摘要或新闻标题的质量,并提出 - EMNLP基于联合上下文驱动关注机制的神经网络相关工作总结
这篇论文提出了一种基于神经网络的自动文献摘要生成方法,使用 seq2seq 模型和上下文感知机制,同时考虑全文和参考文献的异构关系,以保持相关工作部分和目标文献的主题连贯性,并在大规模数据集上获得了优越的实验结果。
- 下一步是什么?基于下一句预测的提取式摘要
使用 NEXTSUM 方法进行文章自动摘要,通过模型预测下一个句子是否应该包含在摘要中来兼顾信息的完整性和紧凑性,实验结果表明比传统方法表现更好。
- ICML通过自动摘要探索句向量空间
利用神经网络对单词进行矢量表示后,本文探讨了在自动文摘的语境下,矢量表示的句子向量的特性,包括其与文档向量之间的余弦相似度与句子重要性的强关联、向量语义可用于识别和纠正选择的句子和文档之间的差距以及有效摘要所需的特定维度的相关性等。同时,本 - IJCAI一种加强主题感知的卷积序列到序列模型用于抽象文本摘要
本文提出了一种深度学习方法来解决自动摘要任务,通过将主题信息结合到卷积序列到序列 (ConvS2S) 模型中,并使用自举式非监督序列训练 (SCST) 进行优化。通过联合关注主题和单词级别对齐,我们的方法可以通过有偏的概率生成机制改善生成摘 - 使用 Softmax 策略梯度的冷启动强化学习
本文提出了一种基于 softmax 价值函数的强化学习方法,它不需要 warm-start 和样本方差的降低,结合了 policy-gradient 方法和最大似然方法的优点,用于训练结构化输出预测问题的序列生成模型,经实验证明,在文本自动 - 科学论文摘要的监督式提取方法
本文介绍了一种新的数据集,用于总结计算机科学出版物,展示了利用神经句子编码和传统的总结功能来开发模型的方式,并表明即使在传统的科学领域中,对句子的编码以及他们的本地和全局背景进行编码的模型也有很好的性能,并实现了明显优于已经建立的基准方法的 - IJCAI基于分心注意力的神经网络文档摘要
本文提出基于神经网络的 attention 模型来对长文档进行自动摘要。通过追踪文档主题之间的切换,模型实现了更好的文档理解效果,并在两个大型数据集上取得了最优表现。
- WWW利用依存图融合进行抽象会议摘要
本文介绍了一种基于整数线性规划的句子融合方法,用于从多个发言中提取重要内容生成摘要,并实验证明该方法能够生成比现有基准更为信息丰富的自动生成会议记录的摘要。
- MM口语会议决策总结
本文研究了口语会议中决策摘要的自动化方法,比较了基于词元和对话行为的两种自动摘要方法,使用了有监督和无监督学习框架,发现基于无监督分区的摘要与使用基于有监督技术生成的分区的摘要相当 (使用 LDA 主题模型的 ROUGE-F1 为 0.22