ACLOct, 2022

利用期望统计规则改进低资源跨语言解析

TL;DR本研究提出了一种新颖的基于期望的统计正则化技术 (ESR),利用低阶的多任务结构统计来塑造模型分布,适用于在低资源数据集上做半监督学习。我们将 ESR 应用到跨语言转移学习中,对句法分析 (POS 标记和带标签依存分析) 进行研究,并提出了几种低阶统计函数,证明了其优越性。实验证明,当准确估计时,提出的统计量与 ESR 在 5 种不同的目标语言上均能显著改善 POS 和 LAS。同时,我们还进行了半监督转移和学习曲线实验,结果表明,ESR 在少量标记数据上提供了更好的性能,比强大的跨语言转移加微调基线模型表现更优秀。这些结果表明,ESR 是跨语言解析模型转移方法的一种有前途和互补的方法。