ACLApr, 2024

基于 LLM 的部分识别在开源方面表现出色,但在现实世界应用中遇到困难

TL;DR使用大型语言模型(LLMs)对电子健康记录(EHR)中的相关章节标题进行识别,发现 GPT-4 在零和少数样本情况下均能有效解决问题,并且在分段方面表现明显优于现有方法。然而,对于一个更难的真实世界数据集,GPT-4 难以表现良好,因此需要进一步研究和更难的评估标准。