利用大型语言模型识别和提取罕见疾病表型
临床深度表型化和本体概念建模在罕见疾病患者的诊断和护理协调计划中起着重要作用。本研究使用大型语言模型评估了最新的生成预训练变压器模型在临床深度表型化的性能,结果表明这些模型在临床环境中的使用存在问题。
Sep, 2023
通过使用零射击的基于大型语言模型的方法,结合检索增强生成和 MapReduce 技术,我们在肺动脉高压领域展示了一种有效识别疾病的方法,该方法在诊断中明显优于医生逻辑规则(F1 分数为 0.62 比 0.75),从而有望增强罕见疾病群体的识别和推动临床研究以及关注空缺的发现。
Dec, 2023
利用传统的基于词典的自然语言处理工具与大型语言模型相结合的新型混合方法,提高了从非结构化临床记录中识别罕见疾病的能力,并显示了从临床记录中识别病患的潜力。
May, 2024
本研究旨在探究以零注释方式进行临床命名实体识别任务中,OpenAI 开发的大型语言模型 ChatGPT 以两种不同提示策略的潜力。我们将其与 GPT-3 在类似的零注释情况下进行比较,以及使用来自 MTSamples 的一组合成临床笔记的精调 BioClinicalBERT 模型。研究发现,与 GPT-3 相比,ChatGPT 在零注释情况下表现优异,并且使用不同的提示策略可以过提高其性能。虽然 ChatGPT 的表现仍低于 BioClinicalBERT 模型,但本研究证明了 ChatGPT 在不需要注释的情况下进行临床 NER 任务的巨大潜力。
Mar, 2023
应用基于提示的大型语言模型在临床试验中基于资格标准对患者进行分类的研究提供了有希望的分数,并提出了一种利用 SNOMED CT 本体论进行提取式摘要的方法,该方法也可以应用于其他医学文本。
Apr, 2024
本文研究了如何使用大型语言模型在缺乏公共医疗语料库和注释的情况下,零和少样本学习从临床文本中提取信息,包括跨度识别、令牌级序列分类和关系提取。通过引入新的 CAS 数据集并进行手动再注释,GPT-3 系统在这些任务上明显优于现有的零和少样本基线。
May, 2022
这项研究探讨了提示生成在命名实体识别(NER)任务中的可用性以及在不同设置下的性能。研究强调了种子质量而非数量对于给 NER 模型提供输入的重要性。
Nov, 2023
本文提出了一个基于本体和弱监督的方法,使用最近的 BERT 上下文表示进行文本表型处理,该方法可用于从临床笔记中识别出以往难以识别的罕见疾病的患者角色,无须领域专家的注释数据,可提高不少于 30% 至 50% 的精确度。
May, 2022
在使用真实的大型电子病历数据库进行两项分析后,发现 ChatGPT 和 GPT-4 可以通过思路链和几次提示,准确地完成疾病分类任务,并为卫生保健工作者提供诊断辅助,但是这些模型目前存在错误陈述、忽视重要医学发现、推荐不必要的调查和过度治疗等问题,并伴随有隐私问题,因此仍不适用于现实世界的临床使用。不过,与传统机器学习工作流程的配置相比,这些模型所需的数据和时间较少,突出了它们在卫生保健应用中的可扩展性潜力。
Jul, 2023
本研究探讨了专有和本地大型语言模型在基于标记的临床实体识别中的有效性,挖掘了这些模型在零样本提示、少样本提示、检索增强生成以及指令微调等实验中面临的困难,并提出了在医疗保健领域中应用大型语言模型的可能改进方法。
Jun, 2024