Apr, 2020

标点复原的对抗迁移学习

TL;DR本研究旨在解决文本标点还原中词向量只包含从左到右上下文信息和外部词性标注器的不足。为此,引入敌对式迁移学习和多任务联合学习,将预训练双向编码器表示模型用于初始化标点模型,利用多个任务的学习提高模型效果,在 IWSLT2011 数据集上进行实验,结果表明本文提出的模型相较于以往基于词法特征的模型,在测试集上的 F1-score 表现提高了 9.2%。