EMNLPDec, 2022

WIDER & CLOSER: 短通道蒸馏器的混合物用于零样本跨语言命名实体识别

TL;DR本研究提出了一种混合短通道蒸馏方法(MSD),旨在完全互动教师模型中的丰富分层信息,并足够高效地将知识转移给学生模型,通过在多个蒸馏器聚合为混合物的多通道蒸馏框架实现信息传输。此外,还提出了一种无监督方法,采用平行领域自适应来缩短教师和学生模型之间的通道,以保留域不变特征。在 4 个数据集上跨越 9 种语言的实验表明,所提出的方法在零样本跨语言命名实体识别方面取得了新的最先进性能,并在语言和领域之间展现出很好的泛化和兼容性。