ACLMay, 2024

LG AI Research & KAIST 参与 EHRSQL 2024:利用伪标记的无法回答的问题自我训练大语言模型,构建可靠的电子病历文本到 SQL 系统

TL;DR通过使用伪标记的无法回答的问题,我们提出了一种自我训练策略,以提高电子健康记录(EHR)的文本转 SQL 模型的可靠性。该方法包括两阶段的训练流程,紧接着使用基于令牌熵和查询执行的过滤方法。在 EHRSQL 2024 共享任务中,我们的方法证明了其有效性并展示了通过更可靠的文本转 SQL 系统改善医疗决策的潜力。