Jun, 2023

基于 R-Drop 结构改进的 Transformer 中的命名实体识别研究

TL;DR该文介绍了一种名为 XLNet-Transformer-R 的模型,结合 XLNet 预训练模型和相对位置编码的 Transformer 编码器,以提高模型的泛化能力和处理长文本的能力,在防止过拟合的同时提高命名实体识别任务的准确性,并通过 MSRA 数据集的消融实验和四个数据集的比较实验证明了该模型的有效性。