EMNLPNov, 2023

利用密切相关语言的形态学知识进行弱监督的低资源语言深度同源检测框架

TL;DR为了解决资源匮乏语言中的迁移学习问题,本研究提出了一种基于形态学知识的跨语言弱监督深度同源词检测框架,通过训练编码器获得语言的形态学知识,并将此知识转移至密切相关的语言以进行无监督和弱监督的同源词检测。在不同的语系上进行了实验,得到了显著的改进和超越最先进的监督和无监督方法的结果。该模型对于任何语系的各种语言都具有扩展性,因为它克服了对同源词对进行训练注释的要求。