Feb, 2022

GatorTron:从非结构化电子病历中解锁患者信息的大型临床语言模型

TL;DR本研究构建并评估了 GatorTron,一个基于临床语言的自然语言处理大型模型,训练数据包含 90 多亿个单词,其中包括 82 多亿个去识别化的临床文本。该模型在临床概念提取、医学关系提取、语义文本相似度、自然语言推断和医学问答等 5 个临床自然语言处理任务上都表现出众,并在可伸缩性方面得到了优化。