LG AI Research & KAIST 参与 EHRSQL 2024：利用伪标记的无法回答的问题自我训练大语言模型，构建可靠的电子病历文本到 SQL 系统

ACLMay, 2024

LG AI Research & KAIST 参与 EHRSQL 2024：利用伪标记的无法回答的问题自我训练大语言模型，构建可靠的电子病历文本到 SQL 系统

LG AI Research & KAIST at EHRSQL 2024: Self-Training Large Language Models with Pseudo-Labeled Unanswerable Questions for a Reliable Text-to-SQL System on EHRs

PDF

Yongrae Jo, Seongyun Lee, Minju Seo, Sung Ju Hwang, Moontae Lee

TL;DR通过使用伪标记的无法回答的问题，我们提出了一种自我训练策略，以提高电子健康记录（EHR）的文本转 SQL 模型的可靠性。该方法包括两阶段的训练流程，紧接着使用基于令牌熵和查询执行的过滤方法。在 EHRSQL 2024 共享任务中，我们的方法证明了其有效性并展示了通过更可靠的文本转 SQL 系统改善医疗决策的潜力。

Abstract

text-to-sql models are pivotal for making electronic health records (EHRs) accessible to healthcare professionals without SQL knowledge. With the advancements in large language models, these systems have become m

text-to-sql models electronic health records self-training strategy unanswerable questions reliability

发现论文，激发创造

PromptMind 团队在 EHRSQL-2024 上：使用集成 LLMs 提高 SQL 生成的可靠性

使用大型语言模型（LLM）进行提示和微调的两种方法以生成 EHRSQL 查询，结果表明这些方法在准确执行和可靠性方面都表现优秀，并且集成方法通过减少错误进一步提高了生成的可靠性。这些方法可应用于强调准确性和可靠性的特定领域的文本转 SQL 问题。

May, 2024

EHRSQL 2024 可靠电子健康记录文本到 SQL 建模共享任务概述

电子健康档案（EHRs）是存储医院患者整个病史的关系型数据库，通过构建问答系统、利用文本到 SQL 的模型将自然语言问题转化为对应的 SQL 查询并使用这些查询检索答案，可以提供医疗专业人员所需的答案，改进其临床工作流程并满足其需求。

May, 2024

KU-DMIS 在 EHRSQL2024 上的研究：通过问题模板化生成 SQL 查询

使用新颖的文本至 SQL 框架，我们处理超出数据库范围或超出系统能力的无法回答的问题，将其标准化并与表模式相结合，以确保准确的数据检索，实现在临床自然语言处理工作坊的 EHRSQL-2024 挑战中具有竞争力的表现。

May, 2024

电子病历文本到 SQL 的实用基准测试

我们提出了一种新的文本到 SQL 数据集，用于电子健康记录（EHRs）。该数据集提供了一个挑战，需要模型可以生成反映医院需求范围的 SQL 查询，包括简单检索和复杂操作，如计算生存率，同时需要理解时间表达式以回答与时间敏感相关的问题，并根据预测置信度区分问题是否有答案，以发展和评估结构化 EHR 数据上的 QA 模型并迈向文本到 SQL 研究和医疗保健方面部署之间的缩小差距。

Jan, 2023

针对结构化电子病历的问答不确定性感知文本转程序

本文设计了程序为基础的模型（NLQ2Program）以利于未来拓展医疗多模态数据和解决复杂推理的电子健康记录问答任务，该模型在没有金标程序的情况下表现良好，运用不确定性分解方法可测度输入问题的模糊性。

Mar, 2022

朝着无偏评估电子病历 SQL 中无法回答问题的检测

为了测试系统的可信度，将无法回答的问题纳入电子病历问答系统是至关重要的，因为提供不存在的答案可能会误导医生的诊断。然而，我们的工作中发现了 EHR QA 系统中这些无法回答问题存在的数据偏见，它们往往可以通过特定的 N-gram 模式过滤来辨别。这样的偏见危及 QA 系统评估的真实性和可靠性。为解决此问题，我们提出了一种简单的去偏方法，通过调整验证集和测试集之间的分割来中和 N-gram 过滤的不适当影响。通过对 MIMIC-III 数据集的实验，我们展示了 EHRSQL 的现有数据偏见以及我们的数据划分策略在减轻这种偏见方面的有效性。

Apr, 2024

EHRSQL 2024 中的 ProbGate: 通过概率阈值过滤和错误处理提高 SQL 查询生成的准确性

利用深度学习的语言模型对医学领域的病历查询进行转换成 SQL 查询的实证研究，并使用熵基方法和基于概率分布的方法过滤无法回答的结果，从而实现了有效的病历查询结果过滤。

Apr, 2024

TrustSQL：具备多样性无法回答问题的文本到 SQL 模型可靠性基准测试

近期对于大型语言模型的研究取得了显著进展，特别是在将自然语言问题翻译为 SQL 查询方面的准确性能大幅提升。然而，对于实际部署中遇到的各种类型问题，包括无法回答的问题，这些文本到 SQL 模型的可靠性还知之甚少。为了探讨这个方面，我们提出了 TrustSQL，这是一个新的基准系统，旨在评估文本到 SQL 模型在单数据库和跨数据库设置下的可靠性。基准任务要求模型给出两种结果之一：1）SQL 预测；2）不进行预测，无论是由于生成的 SQL 可能存在问题，还是面对无法回答的问题。为了对模型进行评估，我们探索了特定于该任务的各种建模方法，包括：1）为可回答性检测、SQL 生成和错误检测优化独立的模型，然后将它们集成到一个单一的流程中；2）开发一个统一的方法，优化一个单一模型来解决所提出的任务。实验证实了我们的新可靠性评分，表明解决这一挑战涉及到许多不同的研究领域，并为模型发展开辟了新的途径。然而，尽管有这么多的方法，但没有一种能够超越纯基准的可靠性性能，即放弃回答所有问题。

Mar, 2024

电子病历问答文本到 SQL 的生成

本文利用深度学习技术提出了一种新的基于 Translate-Edit 模型的健康医疗 Question-to-SQL 语句生成方法，并在公开的电子病历数据库 MIMIC 上进行了广泛实验。结果表明，该方法可适应医疗领域中常见的缩写与错别字，对病情信息的预测表现良好。

Jul, 2019

利用电子健康记录的流行病学问题回答中的检索辅助文本转 SQL 生成

引入一种基于文本到 SQL 生成和检索增强生成（RAG）的端到端方法，利用电子健康记录和索赔数据回答流行病学问题，研究表明该方法显著提高了性能，对提高语言模型能力有应用前景。

Mar, 2024