IJCAIJun, 2022

在跨领域命名实体识别中寻找最优的子词分词

TL;DR本研究提出了一种基于子词的解决方案(X-Piece),通过重新令牌化源域的输入单词以接近目标子词分布,来解决交叉域命名实体识别中的输入词级分布偏移问题,实验证明了这种方法基于 BERT-tagger 在四个基准 NER 数据集上的有效性。