通过结论生成来理解医学随机对照试验
本文介绍了一种新的任务和语料库,通过全文文章描述随机对照试验 (RCT) 的方式,推断与给定干预、比较和预期结果相关的报告发现,结果表明这项任务的困难性主要归因于长篇的技术性输入文本。
Apr, 2019
本文介绍了 PubMed 200k RCT 数据集,该数据集基于 PubMed 用于序列句子分类,旨在为开发更准确的算法和在文献阅读方面提供更好的工具。
Oct, 2017
本文使用专业医学人士对 GPT-3 生成的医学文章摘要进行了评估,发现 GPT-3 虽然能够忠实地总结和简化单篇生物医学文章,但在多篇文章发现的证据综合方面存在困难。
May, 2023
本研究建议并评估了基于指令调优的大型语言模型的文本 - to - 文本模型,以共同从临床摘要中提取干预、结局和对照元素(ICO 元素)并推断所报道的相关结果。
May, 2023
本研究中,我们探讨了使用现代神经模型从多个试验报告中自动生成叙述性生物医学证据摘要的问题,并使用 Cochrane 协作成员先前进行的系统性评论的相关文章摘要的抽象概述来评估现代神经模型进行抽象总结的效果。我们征求了医学专业人员对生成的摘要进行评估,并发现现代总结系统产生了一致流畅和相关的概述,但并非总是准确。我们提出新的方法通过明确划分传达关键发现的输入片段、强调大规模和高质量试验报告等领域特定的模型来信息摘要,发现这些策略适度提高了生成摘要的准确性。最后,我们提出了一种新的方法来自动生成叙述性证据综述的事实性评估,使用可推断报道发现方向的模型。
Aug, 2020
为了优化临床试验的设计,我们提出了一种新的临床试验结果预测(CTRP)任务,并利用大规模非结构化结构的医学文献中的语句隐含地包含 PICO 和结果的证据,预训练模型在下游数据集上进行微调得到更好的表现,针对 COVID-19 的另一个数据集也验证了性能提升。
Oct, 2020
该研究提出了一种基于文献摘要的新方法来预测临床试验干预措施的有效性。通过抽取摘要中表达干预措施有效性的句子,生成一个简洁的摘要,用于训练 BERT 分类器以预测干预措施的有效性。实验结果证明了该方法的有效性。
Apr, 2022
TrialsSummarizer 是一个基于神经多文档摘要系统的自动摘要系统,它可以检索与查询指定的条件、干预和结果匹配的随机对照试验出版物,并对这些研究进行排名。它提供了两种体系结构:基于 BART 的标准序列到序列模型和旨在为最终用户提供更大透明度的多头体系结构。但是,这些模型都存在引入不受支持语句的倾向,不适用于当前领域。所提出的架构可以帮助用户验证输出,使用户能够将生成的令牌追溯到输入。
Mar, 2023
我们评估了 GPT 在四个封闭式生物医学机器阅读理解基准测试上的表现,提出了一种名为 Implicit Retrieval Augmented Generation(IRAG)的提示策略,该策略通过减少传统 RAG 设置中使用向量数据库检索重要部分的需求来解决 LLM 所固有的检索问题,并通过定性评估展示了该方法的自然语言生成输出。实验结果表明,我们的新提示技术在四个数据集中有两个取得了最佳效果,并在其余两个中排名第二。实验还表明,像 GPT 这样的现代 LLM,即使在零 - shot 设置中,也能胜过监督模型,从而在两个基准测试中取得了最新技术水平的成果。
May, 2024