Mar, 2022

MarkBERT:标注词边界提升中文BERT表现

TL;DR本研究提出了一种名为MarkBERT的中文BERT模型,此模型使用了单词信息并在中文字符之间插入了边界标记,具有较好的对OOV词汇的处理能力和较好的语义标注表现,可以通过插入边界标记轻易地增加单词级别的学习目标,并有效提高下游任务表现。