基于预训练语言模型的医学文本摘要综述
本篇论文综述了近期预训练语言模型在生物医学领域的研究进展及其在生物医学下游任务中的应用,提出了现有生物医学 PLMs 的分类及其在下游任务中的应用,讨论了其限制与未来发展趋势。
Oct, 2021
通过深度神经网络、预训练语言模型和最新的大型语言模型的出现,文本摘要研究经历了几次重大转型,本文综述通过这些范式转变的视角全面回顾了文本摘要研究的进展和演变,分为两个主要部分:(1) 在大型语言模型时代之前的数据集、评估指标和摘要方法的详细概述,包括传统统计方法、深度学习方法和预训练语言模型微调技术,以及 (2) 大型语言模型时代中对基准测试、建模和评估摘要的最新进展的首次详细研究。通过综合现有文献并提供一个连贯的概述,本文还讨论了研究趋势、面临的挑战以及在摘要研究中提出的有希望的研究方向,旨在引导研究人员了解摘要研究的不断演变的领域。
Jun, 2024
使用大型语言模型改进自动化文档摘要,尤其在简化复杂技术文件、生成背景知识、评估文本中起到了重要作用,并在医学文章的简化和评估方面做出了创新性的工作。
Feb, 2024
在本研究中,我们采用八个大型语言模型,在六个数据集和四个不同的摘要任务(放射学报告、患者问题、进展记录和医生 - 患者对话)上应用领域适应方法,系统评估了它们的效果,而且展示出最佳适应的大型语言模型的摘要相较于人工摘要在完整性和正确性方面更可取。此外,我们还将传统的自然语言处理指标与医生评分进行了相关性分析,以提高对这些指标与医生喜好的理解。最终,我们的研究证明了大型语言模型在多个临床文本摘要任务中超越人工专家,这意味着将大型语言模型整合到临床工作流程中可以减轻文档负担,使临床医生能够更多关注个性化患者护理和其他医学中不可替代的人工环节。
Sep, 2023
本文提出了一种方法,旨在通过集成先验知识和先前训练的语言模型来辅助实现从外部来源获取信息和检索正确文件的目标,在两个生物医学领域的数据集上的实验表明,该方法显著提高了文档重新排序任务的效果。
May, 2023
本文介绍了一个新的自动生成生物医学科学综述文献简化版的任务,并通过分析各种挑战,实验和评估,展示了使用现代神经架构自动生成的简化版摘要可以达到良好的质量和可读性。
Dec, 2020
本文介绍了生物医学机制总结任务,并利用少量手工标注的机制句子,训练了机制句子分类器以过滤大量的生物医学摘要并创建了一个包含 22k 实例的总结数据集。此外,我们还引入了 611k 实例的结论句子生成作为预训练任务,并基准测试了大型生物领域语言模型的性能。我们发现,虽然预训练任务有助于提高性能,但最佳模型仅在 32%的情况下产生可接受的机制输出,这表明该任务在生物医学语言理解和总结方面面临巨大挑战。
May, 2022
大型语言模型在医疗保健领域的部署引发了热情和忧虑,本综述论文探讨了针对医疗保健应用设计的现有大型语言模型的功能,从传统的预训练语言模型到目前的医疗保健领域的大型语言模型发展轨迹,特别关注临床语言理解任务的潜力以及性能评估、挑战和限制。
Dec, 2023
最近,大型语言模型 (LLM) 在解决各种任务方面展现了令人印象深刻的能力。然而,尽管在各种任务中取得了成功,但以前的研究尚未调查它们在生物医学领域的能力。为此,本文旨在评估 LLMs 在基准生物医学任务中的性能。为此,我们对 26 个数据集中 6 个不同生物医学任务的 4 种流行 LLMs 进行了全面评估。据我们所知,这是第一次在生物医学领域对各种 LLMs 进行广泛评估和比较。有趣的是,基于我们的评估结果我们发现,在具有较小训练集的生物医学数据集中,零次矫正的 LLMs 甚至在效果上超过了当前最先进的生物医学模型。这表明,在大型文本语料库上进行预训练使 LLMs 在生物医学领域具有了相当专业的能力。我们还发现,在所有任务中没有单个 LLM 能够胜过其他 LLMs,不同 LLMs 的性能可能会因任务而异。尽管与在大型训练集上进行精细调整的生物医学模型相比,它们的性能仍然相当差,但我们的研究结果表明,LLMs 在缺乏大规模注释数据的各种生物医学任务中具有潜在的价值工具。
Oct, 2023