Mar, 2023

带检索的分类方法及其解耦表示

TL;DR本文提出了一种混合粒度的中文BERT模型(MigBERT),通过同时考虑字符和词,设计了学习字符和单词级表示的目标函数,在各种中文NLP任务上获得了新的SOTA性能,实验结果表明,单词语义比字符更丰富,而MigBERT也适用于日语。