SDOH-NLI:从医疗记录中推断卫生社会因素的数据集
本文介绍了 n2c2/UW SDOH 挑战的共享任务、数据、参与团队、性能结果以及未来工作的考虑,并探讨了使用自然语言处理技术和预训练的语言模型提取 SDOH 和临床信息的前景。
Jan, 2023
该研究介绍了三种系统, 分别使用机器学习分类器、 大型语言模型和机器学习候选短语与手工规则相结合的方式, 达到识别临床叙述中社会健康影响因素 (SSOH) 的目的;三种方法在 NLP Challenge 中的 Subtask A 上获得 F1 分数分别为 0.884、 0.831 和 0.663, 结果表明每个方法在实际应用中都有优点和缺点, 其选择不仅取决于 F1 分数, 还取决于应用的要求。
Jan, 2023
社会卫生决定因素(SDoH)在塑造健康结果方面起着关键作用,特别是在儿科人群中,干预措施可能具有长期影响。本研究提出了一个新的标注语料库,儿科社会历史标注语料库(PedSHAC),并使用经过精细调优和上下文学习方法结合大型语言模型(LLMs)来评估详细的 SDoH 表征的自动提取。PedSHAC 包括从华盛顿大学医院系统的儿科患者的 1,260 个临床记录中获取的已标注的社会历史部分。采用一个基于事件的标注方案,PedSHAC 涵盖了十个不同的健康决定因素,包括生活和经济稳定性、先前的创伤、教育机会、物质使用历史和心理健康,整体标注一致性为 81.9 F1。我们提出的精细调整的基于 LLM 的提取器以 78.4 F1 的事件参数高性能实现。搭配 GPT-4 的上下文学习方法在有限的标注示例情况下展现了可靠的 SDoH 提取的前景,事件触发器的提取性能达到 82.3 F1。
Mar, 2024
本研究使用大型语言模型从电子健康记录中提取社会健康决定因素(SDoH),并研究了合成临床文本对提取这些临床数据的改进作用。最佳模型是经过微调的 Flan-T5 XL(宏 F1 值为 0.71)任何 SDoH 和 Flan-T5 XXL(宏 F1 值为 0.70)。这些模型优于 ChatGPT 系列模型在任务中的零样本和少样本性能,并且对种族 / 民族和性别描述词的预测不太可能改变,表明较少的算法偏见(p<0.05)。在患者层面上,我们的模型识别出 93.8% 存在不良 SDoH 的患者,而 ICD-10 代码只能覆盖 2.0%。我们的方法能有效地从临床记录中提取 SDoH 信息,相对于 GPT 的零样本和少样本设置更加优秀。这些模型可以增强关于 SDoH 的现实世界证据,并帮助识别需要社会支持的患者。
Aug, 2023
本文使用 SHAC 数据集中的社交史部分,采用 GPT-4 的一次性提示設置探索 SDOH 信息的自动提取,其中包括物質使用,就业和生活状况信息,和采用高性能监督方法将 GPT-4 提取性能与其进行比较,并进行彻底的错误分析。GPT-4 的提示方法在 SHAC 测试中获得了总体 0.652 的 F1,类似于 n2c2 挑战中最好的 7 个系统之一
Jun, 2023
通过对 0.95 百万份社会工作者记录的词频分析和 LDA 主题建模分析,本文确定了社会卫生风险因素的 11 个主题,包括财务状况、虐待史、社会支持、死亡风险和心理健康等,证明了社会工作者提供了个人社会决定因素上富有独特性和不可获得性的信息。
Dec, 2022
本篇论文旨在开发一个开源的自然语言处理软件包 SODA,利用预先训练的 Transformer 模型提取癌症患者的社会决定因素,并检验其在新的疾病领域(如鸦片类药物使用)的适用性及 SDoH 的提取效率。研究使用四种基于 Transformer 的自然语言处理模型提取 SDoH,探索改善性能的策略。最好的模型成功地从不同类型的癌症患者中提取了 19 个 SDoH 类别。
Dec, 2022
使用结构化和非结构化数据识别出社会健康决定因素,特别是 NLP 提取 SDOH,发现该因素与退伍军人的自杀风险密切相关
Dec, 2022
本研究将公共可用的电子病历数据库 MIMIC-IV 与健康社会决定因素(SDOH)特征进行关联,调查这些特征对不同病人群体常见电子病历预测任务的影响,发现社区水平的 SDOH 特征在一般病人群体中无法提高模型性能,但能提高特定亚人群的数据有限模型的公平性;同时,表明 SDOH 特征对于进行超越保护性属性的算法偏见全面审计至关重要。我们希望新的集成型电子病历 - SDOH 数据库能够启动有关社区健康与个人结果之间关系的研究,并提供全新的用于研究超越种族、性别和年龄等算法偏见的基准。
May, 2023
社会卫生决定因素(SDOH)在患者健康结果中发挥重要作用。我们介绍了一种智能路由系统,通过语言模型路由将医疗记录数据传输到对特定 SDOH 代码表现出最佳性能的开源 LLMs,以实现在一组医学编码子任务中的高性能。
May, 2024