探索社会健康因素的临床社工笔记主题建模
社会卫生决定因素(SDoH)在塑造健康结果方面起着关键作用,特别是在儿科人群中,干预措施可能具有长期影响。本研究提出了一个新的标注语料库,儿科社会历史标注语料库(PedSHAC),并使用经过精细调优和上下文学习方法结合大型语言模型(LLMs)来评估详细的 SDoH 表征的自动提取。PedSHAC 包括从华盛顿大学医院系统的儿科患者的 1,260 个临床记录中获取的已标注的社会历史部分。采用一个基于事件的标注方案,PedSHAC 涵盖了十个不同的健康决定因素,包括生活和经济稳定性、先前的创伤、教育机会、物质使用历史和心理健康,整体标注一致性为 81.9 F1。我们提出的精细调整的基于 LLM 的提取器以 78.4 F1 的事件参数高性能实现。搭配 GPT-4 的上下文学习方法在有限的标注示例情况下展现了可靠的 SDoH 提取的前景,事件触发器的提取性能达到 82.3 F1。
Mar, 2024
本研究使用大型语言模型从电子健康记录中提取社会健康决定因素(SDoH),并研究了合成临床文本对提取这些临床数据的改进作用。最佳模型是经过微调的 Flan-T5 XL(宏 F1 值为 0.71)任何 SDoH 和 Flan-T5 XXL(宏 F1 值为 0.70)。这些模型优于 ChatGPT 系列模型在任务中的零样本和少样本性能,并且对种族 / 民族和性别描述词的预测不太可能改变,表明较少的算法偏见(p<0.05)。在患者层面上,我们的模型识别出 93.8% 存在不良 SDoH 的患者,而 ICD-10 代码只能覆盖 2.0%。我们的方法能有效地从临床记录中提取 SDoH 信息,相对于 GPT 的零样本和少样本设置更加优秀。这些模型可以增强关于 SDoH 的现实世界证据,并帮助识别需要社会支持的患者。
Aug, 2023
本文介绍了 n2c2/UW SDOH 挑战的共享任务、数据、参与团队、性能结果以及未来工作的考虑,并探讨了使用自然语言处理技术和预训练的语言模型提取 SDOH 和临床信息的前景。
Jan, 2023
该研究介绍了三种系统, 分别使用机器学习分类器、 大型语言模型和机器学习候选短语与手工规则相结合的方式, 达到识别临床叙述中社会健康影响因素 (SSOH) 的目的;三种方法在 NLP Challenge 中的 Subtask A 上获得 F1 分数分别为 0.884、 0.831 和 0.663, 结果表明每个方法在实际应用中都有优点和缺点, 其选择不仅取决于 F1 分数, 还取决于应用的要求。
Jan, 2023
本研究将公共可用的电子病历数据库 MIMIC-IV 与健康社会决定因素(SDOH)特征进行关联,调查这些特征对不同病人群体常见电子病历预测任务的影响,发现社区水平的 SDOH 特征在一般病人群体中无法提高模型性能,但能提高特定亚人群的数据有限模型的公平性;同时,表明 SDOH 特征对于进行超越保护性属性的算法偏见全面审计至关重要。我们希望新的集成型电子病历 - SDOH 数据库能够启动有关社区健康与个人结果之间关系的研究,并提供全新的用于研究超越种族、性别和年龄等算法偏见的基准。
May, 2023
该研究介绍了一个新的数据集 SDOH-NLI,基于公开可用的笔记,通过将社会和行为决定因素提取为自然语言推理任务,从而帮助健康护理提供者系统地识别提供适当护理和解决差异的机会。
Oct, 2023
本研究旨在从临床笔记中提取具有社会健康决定因素的句子,并利用名为 SOHO 的 SDoH 本体提供适当的概念。我们使用深度学习的最新进展来优化 Clinical BioBERT 模型的超参数,实现了基于遗传算法的超参数调整。通过将 Clinical BioBERT 与两个线性层和两个 dropout 层进行流水线处理,我们实现了完整的分类器。在实验中,我们比较了 AdamW,Adafactor 和 LAMB 优化器。结果表明,AdamW 在准确性方面表现最佳。
Feb, 2023
社会卫生决定因素(SDOH)在患者健康结果中发挥重要作用。我们介绍了一种智能路由系统,通过语言模型路由将医疗记录数据传输到对特定 SDOH 代码表现出最佳性能的开源 LLMs,以实现在一组医学编码子任务中的高性能。
May, 2024
研究使用自然语言处理探究社会因素对癌症治疗选择的影响,发现社会工作者的记录在预测靶向治疗中起着重要作用,并发现许多与临床决策 - making 有关的健康社会决定因素可能会对治疗差异造成贡献。
Jun, 2023
本文使用 SHAC 数据集中的社交史部分,采用 GPT-4 的一次性提示設置探索 SDOH 信息的自动提取,其中包括物質使用,就业和生活状况信息,和采用高性能监督方法将 GPT-4 提取性能与其进行比较,并进行彻底的错误分析。GPT-4 的提示方法在 SHAC 测试中获得了总体 0.652 的 F1,类似于 n2c2 挑战中最好的 7 个系统之一
Jun, 2023