- 建模统一的语义语篇结构实现高质量标题生成
我们提出了使用统一语义话语结构(S3)来表示文档语义的方法,通过将文档级修辞结构理论(RST)树和句级抽象意义表示(AMR)图结合起来构建 S3 图,实现对文档语义的准确捕捉。我们还设计了一个标题生成框架,其中 S3 图被编码为上下文特征, - ACLMukhyansh:面向印度语言的标题生成数据集
该研究提出了 Mukhyansh 数据集,其中包含超过 3.39 百万个印度语言标题 - 文章对,用于解决印度语言标题生成中缺乏高质量标注数据的问题,并通过实证分析证明其表现优于其他模型,跨 8 种印度语言平均 ROUGE-L 得分为 31 - 如何在社交媒体上生成热门帖子标题?
利用社交媒体上的趋势和个人风格自动生成流行的标题,通过多种偏好提取器结合双向和自回归变换器的 MEBART 算法在真实数据集上取得了最先进的性能。
- NumHG: 用于数字为中心的标题生成的数据集
通过 NumHG 数据集,本研究针对标题生成任务中的数字生成问题,对头条生成模型进行了详细调查和评估,并发现数字准确性需要改进,从而表明了 NumHG 数据集在数字为重点的标题生成中推动进展和刺激进一步讨论的潜力。
- WWW使用解释来检测新闻标题中的幻觉现象
ExHalder 是一个用于检测标题幻觉的新框架,通过将公共自然语言推理数据集的知识转化到新闻领域,并学习生成自然语言句子来解释幻觉检测结果,成功解决了标题生成中的幻觉问题。通过超过 6000 个标记的文章标题对,和另外 6 个公开数据集的 - 芬兰语事实新闻标题的自动生成
我们提出了一种新颖的方法,以生成针对给定新闻事件的芬兰语新闻标题为主,通过构建一个模型,该模型使用多个语料库训练,在一个巨大的新闻语料库的帮助下,对其进行微调以进行标题生成任务,并由 3 名芬兰媒体机构的专业记者进行评估,结果表明所提出的方 - EMNLP对比学习增强的作者风格标题生成
本文提出了一种名为 CLH3G 的新型 Seq2Seq 模型,该模型可以利用作者过去写过的文章的历史标题,以改善当前文章的标题生成。通过考虑历史标题,我们可以将作者的风格特征融入到我们的模型中,生成既适合文章又与作者的风格一致的标题。我们进 - ACL利用关键信息建模通过对偶微调来提高数据不足的新闻标题生成
该论文研究了有限数据情况下的标题生成任务,提出了一种新的二元优化方法来发现关键信息和生成标题任务之间的概率对偶约束。在两个公共数据集上的实验结果表明,此方法可以有效地提高语言建模指标和信息准确性指标。
- 基于 Transformer 模型的新闻标题生成技术进展
本文通过对 mBART 和 BertSumAbs 两种基于预训练 Transformer 模型的微调,在俄语新闻 RIA 和 Lenta 数据集上获得了新的最优结果,其中 BertSumAbs 分别将 ROUGE 提高了 2.9 和 2.0 - ACL提高标题生成的真实性
本文旨在提高生成式摘要的真实性,在两个流行数据集上进行了标题生成的研究,发现总结存在虚假性,且虚假性的监督数据会导致模型行为不真实,通过二分类器过滤掉虚假数据并重新训练模型可以在不影响 ROUGE 分数的情况下提高摘要标题的真实性。
- ACL标题中的钩子:学习使用受控样式生成标题
本研究提出了一种新的任务 —— 文体标语生成(SHG),通过将摘要和重构任务组合成一个多任务框架以及新颖的参数共享方案,为文摘添加了三个样式选项(幽默、浪漫和点击量讹诈),从而吸引更多读者。通过自动和人工评估,我们证明了 TitleStyl - AAAI吸引人还是忠诚?以受欢迎为基础的学习,用于启发式标题生成
本文介绍了一种名为 POpularity-Reinforced Learning for inspired Headline Generation (PORL-HG) 的新框架,该框架使用强化学习和 Popular Topic Attent - WWW生成新闻故事的代表性标题
试图在不使用人工标注的情况下通过在不同级别上同时使用多个类型的未标注语料库和自投票方法对新闻报道进行标题生成的研究。
- EMNLP使用自动调整的强化学习生成轰动性标题:真新闻还是炒作?
本研究提出了一种模型,它能够生成感性的头条,其使用了在线头条的分类来训练感性评分器,并使用强化学习算法来优化模型的生成结果,模型评估结果表明我们的模型在生成感性头条方面显著优于其他基线模型。
- ACL作为自动评估指标的问答系统在新闻文章摘要中的应用
本研究提出新的评估指标 Answering Performance for Evaluation of Summaries (APES),结合阅读理解领域的进展,通过对中心实体进行手动创建问题的回答能力来评估文章摘要或新闻标题的质量,并提出 - 用于标题生成的自我注意力模型
使用最新的 Universal Transformer architecture 和 byte-pair encoding 技巧,对新闻标题生成任务进行了优化,取得了新的最佳 ROUGE-L F1 分数 24.84 和 ROUGE-2 F1 - EMNLP一种高等级语言模型的直接输出连接
这篇论文提出了一种最新的循环神经网络语言模型,不仅从最后一层,还从中间层计算概率分布。该方法提升了基于杨等人 (2018) 语言建模矩阵分解解释的语言模型的表现力,并在标准基准数据集 Penn Treebank 和 WikiText-2 上 - 基于句子优化的神经网络标题生成
本文介绍了一种使用最小化风险训练策略的神经模型,可以在句子级别上优化模型参数,从而显著提高英文和中文新闻标题生成系统的性能。
- 自动文档摘要的词语和短语对齐
本文主要探讨了目前单文档自动摘要所采用的句子提取和基于词袋模型的标题生成算法的不足,并提出了一种基于词语和短语对齐技术的自动化摘要算法。通过实验结果表明,该模型能够在 <文档,摘要> 数据集中可靠地识别单词和短语的对齐。