Feb, 2023

Bioformer:面向生物医学文本挖掘的高效 Transformer 语言模型

TL;DR本研究提出了 Bioformer,一种用于生物医学文本挖掘的紧凑型 BERT 模型,它在 PubMed 文摘和 PubMed Central 全文文章上进行了预训练,使用生物医学词汇表。Bioformer 相对于 BERTBase 减小了 60%的模型大小,且在四种不同的生物医学 NLP 任务中表现出优异的性能,比如问答,文档分类和命名实体识别等。此外,Bioformer 速度比 PubMedBERT 和 BioBERTBase-v1.1 快 2-3 倍。