BriefGPT.xyz
Nov, 2020
大规模生物医学命名实体识别
Biomedical Named Entity Recognition at Scale
HTML
PDF
Veysel Kocaman, David Talby
TL;DR
通过在Apache Spark之上重新实现Bi-LSTM-CNN-Char深度学习架构,我们提出了一个单可训练的命名实体识别(NER)模型,该模型在七个公共生物医学基准测试中获得了新的最优结果,而不使用像BERT这样的重型上下文嵌入。该模型在生产级别代码库中作为开源Spark NLP库的一部分免费提供,并且可以扩展以支持其他人类语言,而不需要更改代码。
Abstract
named entity recognition
(NER) is a widely applicable natural language processing task and building block of question answering, topic modeling, information retrieval, etc. In the
medical domain
, NER plays a cruc
→