用于公共服务增强的自动文本摘要
本研究论文针对新闻文本自动摘要的抽取和生成方法进行了广泛的比较评估,重点分析了 ROUGE 分数。研究使用 CNN-Daily Mail 数据集,包括新闻文章和人工生成的参考摘要。通过 ROUGE 分数评估生成摘要的效果和质量,再将表现最佳的模型整合到 Web 应用程序中,评估其在真实世界中的能力和用户体验。
Oct, 2023
本文提出了一个文本编辑器,使用自动文本摘要为用户提供不断更新的逐段摘要,以边缘注释的方式帮助用户规划、结构化和反思写作过程。通过两个用户研究,作者发现这个系统为用户提供了一个外部的视角来帮助他们修改段落的内容和范围,并且帮助用户快速了解文本的总体情况和开发一些集成自动摘要中得到的见解的策略。通过探究和强调设计 AI 工具以帮助写作的价值,这项工作突显了自然语言处理 (NLP) 能够超越直接的文本生成和纠正。
Aug, 2022
本研究开发了一个爬虫来提取 Instagram 社交网络上受欢迎的文本文章,并结合一组抽取和抽象算法来展示如何使用每个抽象算法,观察 820 个受欢迎的文本文章在社交网络上的准确性(80%)。
Mar, 2023
本文详细介绍了文本摘要的各种方法,包括提取和抽象两种途径,评估指标、基准数据集与未来的研究展望,并讨论了生成摘要的不同评估方法与相关研究中可能出现的挑战和研究机遇。
Mar, 2022
本文是一篇关于使用自然语言处理技术生成简化版摘要的研究综述,发现基于 transformer 的方法如 BERT 和 PEGASUS 在生成 lay text summarisation 方面相对优秀,并建议采用抽取式和生成式相结合的混合方法,并开发一些新的评估指标以确保 lay summary 更易读。
Mar, 2023
本文综述了近期在基于神经网络的自动文本摘要中的十种最先进的神经网络模型,其中包括五种生成式模型和五种抽取式模型,并讨论了应用于摘要任务的相关技术和未来研究的有前途的方向。
Mar, 2018
本文提出了一种基于问题解答的方法,通过将文本视为小型知识库进行大量提问,以精确地比较两个文本之间的内容差异,从而解决 NLP 系统评估中的一个重要问题。实验结果表明,该方法在分析大型文本语料库方面具有较高的准确性和可靠性。
Apr, 2017
本文介绍了一种新颖且有效的自动生成会议摘要的方法,采用递归生成摘要和并行应用行动项提取算法来生成行动项驱动的抽象会议摘要;同时引入了三种划分长篇会议记录成主题部分的方法,以提高算法的时间效率,并解决大语言模型遗忘长期依赖的问题。实验结果在 AMI 语料库上取得了 64.98 的 BERTScore,相对于精调的 BART 模型,提高了约 4.98% 的准确度。
Dec, 2023
本文提出了使用会议摘要生成自动转录报告的方法。使用自动预对齐方法使数据批量化对齐,最大化语料库的规模,以及使用人工标注者进行更准确地校对。作者还评估了自动对齐和自动摘要的表现,并证明自动对齐可大幅度提高所有 ROUGE 得分。
Jul, 2020
在社交媒体如此发达的时代,我们提出了一个新的流程,其中部分自动化事实检查的生命周期可以节省人力和高认知任务。我们的方法是利用抽象摘要生成简洁的查询,这些查询可以在基于现有已核查实事的数据集的检索系统中执行。通过使用现有的摘要模型进行微调和开箱既食的摘要模型,我们获得了具有更好的检索表现,检索准确率提高了 3 倍,而基于原文查询的准确率仅为 10%。
Sep, 2022