通过结论生成来理解医学随机对照试验

EMNLPOct, 2019

通过结论生成来理解医学随机对照试验

Towards Understanding of Medical Randomized Controlled Trials by Conclusion Generation

Alexander Te-Wei Shieh, Yung-Sung Chuang, Shang-Yu Su, Yun-Nung Chen

TL;DR该论文针对 RCTs，提出使用序列到序列模型，使机器学习辅助临床决策，并通过对比，验证使用针对医学领域的 GPT-2 模型，对整个过程的效果较佳，同时指出该方面的研究仍有待进一步的扩展。

Abstract

Randomized controlled trials (rcts) represent the paramount evidence of clinical medicine. Using machines to interpret the massive amount of rcts has the potential of aiding →

rcts clinical decision-making sequence-to-sequence models gpt-2 conclusion generation

发现论文，激发创造

从临床试验报告中推断哪些医疗治疗方法有效

本文介绍了一种新的任务和语料库，通过全文文章描述随机对照试验 (RCT) 的方式，推断与给定干预、比较和预期结果相关的报告发现，结果表明这项任务的困难性主要归因于长篇的技术性输入文本。

Apr, 2019

PubMed 200k RCT: 医学摘要中用于序列句子分类的数据集

本文介绍了 PubMed 200k RCT 数据集，该数据集基于 PubMed 用于序列句子分类，旨在为开发更准确的算法和在文献阅读方面提供更好的工具。

Oct, 2017

使用 GPT-3 对医学证据进行总结、简化和综合（成功率不同）

本文使用专业医学人士对 GPT-3 生成的医学文章摘要进行了评估，发现 GPT-3 虽然能够忠实地总结和简化单篇生物医学文章，但在多篇文章发现的证据综合方面存在困难。

May, 2023

使用 LLMs 聚合从 RCT 报告中提取干预措施、结果和发现

本研究建议并评估了基于指令调优的大型语言模型的文本 - to - 文本模型，以共同从临床摘要中提取干预、结局和对照元素（ICO 元素）并推断所报道的相关结果。

May, 2023

利用神经多文档摘要生成（事实性的？）随机对照试验纪要：实验研究

本研究中，我们探讨了使用现代神经模型从多个试验报告中自动生成叙述性生物医学证据摘要的问题，并使用 Cochrane 协作成员先前进行的系统性评论的相关文章摘要的抽象概述来评估现代神经模型进行抽象总结的效果。我们征求了医学专业人员对生成的摘要进行评估，并发现现代总结系统产生了一致流畅和相关的概述，但并非总是准确。我们提出新的方法通过明确划分传达关键发现的输入片段、强调大规模和高质量试验报告等领域特定的模型来信息摘要，发现这些策略适度提高了生成摘要的准确性。最后，我们提出了一种新的方法来自动生成叙述性证据综述的事实性评估，使用可推断报道发现方向的模型。

Aug, 2020

利用大型语言模型自动提取随机对照试验的数值结果

现有的大型语言模型在处理复杂结果和推理时表现欠佳，虽然巨大的语言模型可以在二分结果方面接近完全自动的元分析。

May, 2024

通过隐性证据集成预测临床试验结果

为了优化临床试验的设计，我们提出了一种新的临床试验结果预测（CTRP）任务，并利用大规模非结构化结构的医学文献中的语句隐含地包含 PICO 和结果的证据，预训练模型在下游数据集上进行微调得到更好的表现，针对 COVID-19 的另一个数据集也验证了性能提升。

Oct, 2020

通过多文档摘要预测临床试验中干预措施的批准

该研究提出了一种基于文献摘要的新方法来预测临床试验干预措施的有效性。通过抽取摘要中表达干预措施有效性的句子，生成一个简洁的摘要，用于训练 BERT 分类器以预测干预措施的有效性。实验结果证明了该方法的有效性。

Apr, 2022

临床试验证据自动摘要：一个突出当前挑战的原型

TrialsSummarizer 是一个基于神经多文档摘要系统的自动摘要系统，它可以检索与查询指定的条件、干预和结果匹配的随机对照试验出版物，并对这些研究进行排名。它提供了两种体系结构：基于 BART 的标准序列到序列模型和旨在为最终用户提供更大透明度的多头体系结构。但是，这些模型都存在引入不受支持语句的倾向，不适用于当前领域。所提出的架构可以帮助用户验证输出，使用户能够将生成的令牌追溯到输入。

Mar, 2023

GPT 能否重新定义医学认识？对生物医学机器阅读理解中的 GPT 进行评估

我们评估了 GPT 在四个封闭式生物医学机器阅读理解基准测试上的表现，提出了一种名为 Implicit Retrieval Augmented Generation（IRAG）的提示策略，该策略通过减少传统 RAG 设置中使用向量数据库检索重要部分的需求来解决 LLM 所固有的检索问题，并通过定性评估展示了该方法的自然语言生成输出。实验结果表明，我们的新提示技术在四个数据集中有两个取得了最佳效果，并在其余两个中排名第二。实验还表明，像 GPT 这样的现代 LLM，即使在零 - shot 设置中，也能胜过监督模型，从而在两个基准测试中取得了最新技术水平的成果。

May, 2024