MS2: 医学研究的多文档摘要

EMNLPApr, 2021

MS2: Multi-Document Summarization of Medical Studies

Jay DeYoung, Iz Beltagy, Madeleine van Zuylen, Bailey Kuehl, Lucy Lu Wang

TL;DR本研究针对医学干预方案的评估，提供了一个达到自动评估医学文献、整合多个研究结果的新数据集：MS^2。并基于 BART 模型，通过自由文本和结构化形式，提出了用于评估自动生成摘要质量的新指标。

Abstract

To assess the effectiveness of any medical intervention, researchers must conduct a time-intensive and highly manual literature review. nlp systems can help to automate or assist in parts of this expensive process. In support of this goal, we release MS^2 (→

nlp ms^2 dataset multi-document summarization biomedical domain bart summarization system

发现论文，激发创造

临床试验证据自动摘要：一个突出当前挑战的原型

TrialsSummarizer 是一个基于神经多文档摘要系统的自动摘要系统，它可以检索与查询指定的条件、干预和结果匹配的随机对照试验出版物，并对这些研究进行排名。它提供了两种体系结构：基于 BART 的标准序列到序列模型和旨在为最终用户提供更大透明度的多头体系结构。但是，这些模型都存在引入不受支持语句的倾向，不适用于当前领域。所提出的架构可以帮助用户验证输出，使用户能够将生成的令牌追溯到输入。

Mar, 2023

通过多文档摘要预测临床试验中干预措施的批准

该研究提出了一种基于文献摘要的新方法来预测临床试验干预措施的有效性。通过抽取摘要中表达干预措施有效性的句子，生成一个简洁的摘要，用于训练 BERT 分类器以预测干预措施的有效性。实验结果证明了该方法的有效性。

Apr, 2022

NapSS：通过叙述提示和句子匹配摘要实现段落级医学文本简化

该研究提出了一种名为 NapSS 的自动文本简化方法，采用基于句子匹配的摘要生成和提取式摘要相结合的策略来帮助医学领域的非专业人士更好地理解专业文献，相对于基准策略，在保持原始叙述连贯性的同时提高了文本简化的词汇和语义相似性，实验结果表明该方法可以更有效地提高非专业人士的阅读效率。

Feb, 2023

基于预训练语言模型的医学文本摘要综述

本文系统总结了使用预训练语言模型（ Pre-trained language models）的生物医学文本摘要的最新进展、挑战问题和未来方向，帮助我们更好地理解该领域的最新进展和使用预训练语言模型在生物信息学中的应用。

Apr, 2023

医学多文献摘要自动评估指标与人类评估不符

为了改进文献综述的多文件摘要 (MDS)，引入包含人工评估的摘要质量特征和成对偏好的数据集，以支持开发更好的自动评估方法，分析了自动摘要评估度量与生成的摘要词汇特征、其他自动度量以及人工评估摘要质量方面的相关性。发现自动化度量无法完全捕捉到人工评估所评估的质量方面。

May, 2023

利用信息提取和压缩进行大规模多文档摘要

开发了一种基于抽象的总结框架，适用于多个异构文档，该框架独立于标记数据。与现有的多文件总结方法不同，我们的框架处理讲述不同故事的文档，而不是同一主题的文档。最后，我们基于 CNN / Daily Mail 和 NewsRoom 数据集构建了总共十二个数据集变体，其中每个文档组都包含大量且多样化的文档，以评估我们的模型与其他基线系统的性能。我们的实验表明，我们的框架在这种更通用的情况下胜过了现有的最先进方法。

May, 2022

基于深度学习的自动案例摘要系统

本文提出了一种基于深度学习的有效自动案例总结系统，该系统利用最先进的自然语言处理技术，提供了监督和无监督方法来生成简洁且相关的冗长法律案例文件的摘要。用户友好的界面允许用户浏览系统的法律案例库，选择所需案例，并选择他们偏好的总结方法。该系统为法律文本的每个小节以及整体生成全面的摘要。该演示简化了法律案例文档分析，可能通过减轻工作量和提高效率从而使法律专业人员受益。未来的工作将集中在改进摘要技术并探索将我们的方法应用于其他类型的法律文本。

Dec, 2023

科学论文摘要的监督式提取方法

本文介绍了一种新的数据集，用于总结计算机科学出版物，展示了利用神经句子编码和传统的总结功能来开发模型的方式，并表明即使在传统的科学领域中，对句子的编码以及他们的本地和全局背景进行编码的模型也有很好的性能，并实现了明显优于已经建立的基准方法的结果。

Jun, 2017

利用神经多文档摘要生成（事实性的？）随机对照试验纪要：实验研究

本研究中，我们探讨了使用现代神经模型从多个试验报告中自动生成叙述性生物医学证据摘要的问题，并使用 Cochrane 协作成员先前进行的系统性评论的相关文章摘要的抽象概述来评估现代神经模型进行抽象总结的效果。我们征求了医学专业人员对生成的摘要进行评估，并发现现代总结系统产生了一致流畅和相关的概述，但并非总是准确。我们提出新的方法通过明确划分传达关键发现的输入片段、强调大规模和高质量试验报告等领域特定的模型来信息摘要，发现这些策略适度提高了生成摘要的准确性。最后，我们提出了一种新的方法来自动生成叙述性证据综述的事实性评估，使用可推断报道发现方向的模型。

Aug, 2020

医疗文件摘要调查

本文全面调查了医学总结当前技术和趋势，重点关注互联网对医疗保健行业产生的影响，以及通过深度学习与基于 Transformer 的网络，对医学数据的总结和归纳带来的显著性提升。

Dec, 2022