SuMe: 面向生物医学机制概述的数据集

May, 2022

SuMe: 面向生物医学机制概述的数据集

SuMe: A Dataset Towards Summarizing Biomedical Mechanisms

Mohaddeseh Bastan, Nishant Shankar, Mihai Surdeanu, Niranjan Balasubramanian

TL;DR本文介绍了生物医学机制总结任务，并利用少量手工标注的机制句子，训练了机制句子分类器以过滤大量的生物医学摘要并创建了一个包含 22k 实例的总结数据集。此外，我们还引入了 611k 实例的结论句子生成作为预训练任务，并基准测试了大型生物领域语言模型的性能。我们发现，虽然预训练任务有助于提高性能，但最佳模型仅在 32％的情况下产生可接受的机制输出，这表明该任务在生物医学语言理解和总结方面面临巨大挑战。

Abstract

Can language models read biomedical texts and explain the biomedical mechanisms discussed? In this work we introduce a biomedical mechanism summa

biomedical mechanism summarization task language models pretraining task biomedical language understanding

发现论文，激发创造

基于预训练语言模型的医学文本摘要综述

本文系统总结了使用预训练语言模型（ Pre-trained language models）的生物医学文本摘要的最新进展、挑战问题和未来方向，帮助我们更好地理解该领域的最新进展和使用预训练语言模型在生物信息学中的应用。

Apr, 2023

生物医学科学评论的自动化普通语言摘要

本文介绍了一个新的自动生成生物医学科学综述文献简化版的任务，并通过分析各种挑战，实验和评估，展示了使用现代神经架构自动生成的简化版摘要可以达到良好的质量和可读性。

Dec, 2020

利用引用文献的知识聚合提高生物医学文摘生成技术

通过整合源文章中引用的外部论文，本研究旨在提高语言模型在生物医学抽象摘要中的表现。我们提出了一种基于注意力的引文聚合模型，该模型整合了引文论文中的领域特定知识，使神经网络能够利用论文内容和引文论文的相关知识来生成摘要。此外，我们构建并发布了一个大规模的生物医学摘要数据集，为我们的研究奠定了基础。广泛的实验表明，我们的模型优于现有方法，在生物医学抽象文本摘要中取得了显著的改进。

Oct, 2023

生物医学小白指南：规划大型语言模型

使用大型语言模型改进自动化文档摘要，尤其在简化复杂技术文件、生成背景知识、评估文本中起到了重要作用，并在医学文章的简化和评估方面做出了创新性的工作。

Feb, 2024

医学摘要的分类分节：一系列序列分类任务

本研究基于最先进的深度学习模型（SSN-4 模型），探讨了不同的模型组件对表现和复杂性之间的平衡，同时调整单词嵌入来提高性能，并提出了一个解决第一个模型中混淆的对的第二个模型。结果表明，SSN-4 模型似乎不适用于 RCT 数据集之外。

Jan, 2022

针对生物医学文本自动处理的有效句子简化

本文提出了一个名为 bioSimplify 的文本简化方法，试图减少医学文献中的句子复杂度，从而提高句法分析器的性能。经测试，在使用简化后的句子进行分析时，Charniak-McClosky 句法分析器的性能提高了 2.90%，Link Grammar 句法分析器的性能提高了 4.23%。

Jan, 2010

通过多文档摘要预测临床试验中干预措施的批准

该研究提出了一种基于文献摘要的新方法来预测临床试验干预措施的有效性。通过抽取摘要中表达干预措施有效性的句子，生成一个简洁的摘要，用于训练 BERT 分类器以预测干预措施的有效性。实验结果证明了该方法的有效性。

Apr, 2022

生物医学文献的面向实体和事实的抽象摘要生成

本文提出了一种基于实体驱动事实感知的框架，用于训练端到端的基于 Transformer 的编码 - 解码模型以摘要生物医学文章。在使用知识库中的命名实体和事实进行指导的情况下，EFAS 能够实现比标准源文档到摘要设置更准确的实体级事实准确性、N-gram 新颖性和语义等价性，而 ROUGE 指标的表现相当。

Mar, 2022

MS2: 医学研究的多文档摘要

本研究针对医学干预方案的评估，提供了一个达到自动评估医学文献、整合多个研究结果的新数据集：MS^2。并基于 BART 模型，通过自由文本和结构化形式，提出了用于评估自动生成摘要质量的新指标。

Apr, 2021

医疗文本的段落级简化

本研究探讨了如何应用语言模型来改进医学文本的简化，提出了一种基于似然分数的新度量标准，并对编码器解码器模型的新方法进行了评估，同时建立了一些语料库。

Apr, 2021