基于知识图谱的语义驱动填空奖励抽象摘要生成
提出使用层次感知图神经网络(HierGNN)实现文档结构层次分析的自动摘要模型,在 CNN / DM 和 XSum 数据集上分别取得了平均 ROUGE-1/2/L 为 0.55 和 0.75,在人工评估中也证明了其比基线具有更高的内容相关性和较少的冗余。
Nov, 2022
该研究提出了一种名为 SENECA 的抽象概括框架,利用实体信息生成信息丰富且连贯的摘要,该框架采用增强学习连接两个部分,即实体感知内容选择和抽象产生,并通过奖励训练以增加连贯性、简洁性和清晰度,自动和人工评估表明,该模型在 ROUGE 和新闻数据集上优于先前的最新技术,并且其产生的摘要较为信息丰富和连贯。
Sep, 2019
通过将序列编码器与图形成分扩展,我们开发了一个框架,旨在处理文本等弱结构化数据中的长距离关系,从而实现对序列的概括。在广泛的评估中,我们展示了这种混合模型的优越性。
Nov, 2018
本文介绍了一种采用读者评论辅助生成 “主要方面” 摘要的方法 —— 读者感知的生成式摘要。使用对抗思想和神经网络框架,作者提出了一个名为 RASG 的模型,该模型克服了评论的非正式和嘈杂的挑战,并取得了表现优异的成果。
Dec, 2018
本文提出了基于语义图的 BASS 框架,它聚合了分布在长时间范围内的共指短语,并传达了短语之间的丰富关系,从而提高了文档表示和摘要生成过程,为长文档和多文档摘要任务带来了显著的改进。
May, 2021
本文提出了一种基于强化学习的抽象式问题摘要框架,该框架通过 downstream 任务中的问题类型识别和问题重点识别得到两个新颖的奖励来规范问题生成模型,从而确保问题摘要的语义有效并鼓励包含关键的医疗实体 / 重点。作者在两个基准数据集上对其所提出的方法进行了评估,并取得了比现有模型更高的性能。手动评估总结结果表明生成的问题更具多样性且不具备基线总结的不准确性。
Jul, 2021
本论文提出一种快速、精准的摘要生成模型,该模型首先选择重要句子,然后使用新颖的基于句子级的策略梯度方法实现两个神经网络之间的其它计算,最后生成简洁的总体摘要。该模型在 CNN/Daily Mail 数据集上的表现达到了最新的最佳水平,并且具有更高的抽象性得分,同时也展示出相较于之前的长段落编码 - 解码模型,更快的推断速度和训练收敛速度优势,而且在 DUC-2002 数据集上表现更优。
May, 2018
本研究提出了使用检索增强机制和动态图神经网络结构来生成源代码摘要的方法,并在大规模的开源项目数据集上进行了实验,在 ROUGE-L,BLEU-4 和 METEOR 等方面取得了最先进的结果。
Jun, 2020
该研究提出了一种新的解码器,通过条件调整文本和文档的潜在主题来生成摘要,使用 LDA 等主题模型揭示了更多的全局语义信息,使解码器能够访问文本语料库级别的词共现统计信息,实验表明,与现有模型相比,该方法能显著提高 ROUGE 分数。
Aug, 2019
本研究论文使用分布式语义学方法,提出了一种新的奖励制度 DSR (Distributional Semantics Reward),用于评估候选摘要的性能,与传统的奖励模式相比,DSR 可以更准确地捕捉自然语言的词汇和构成多样性。
Aug, 2019