Oct, 2023

无监督成分句法分析的集成蒸馏

TL;DR我们研究了无监督的成分句法分析任务,该任务将句子中的单词和短语组织成层次结构,而不使用语言学注释数据。我们观察到现有的无监督解析器捕捉了句法结构的不同方面,可以利用这些方面来提高无监督解析的性能。为此,我们提出了 “树平均” 方法,并进一步提出了一种新颖的无监督解析集成方法。为了提高推理效率,我们将集成的知识进一步融入到一个学生模型中;这种先集成后蒸馏的过程是缓解常见多老师蒸馏方法中存在的过度平滑问题的一种有效方法。实验证明,我们的方法超过了所有先前的方法,始终表现出其在各种运行,不同的集成组件和领域转移条件下的有效性和鲁棒性。