ACLOct, 2020
结构知识蒸馏:可行地蒸馏结构预测器的信息
Structural Knowledge Distillation: Tractably Distilling Information for Structured Predictor
Xinyu Wang, Yong Jiang, Zhaohui Yan, Zixia Jia, Nguyen Bach...
TL;DR该文提出了一种可用于解决结构化预测问题的知识蒸馏目标函数的分解形式,该分解形式对于许多师生模型的典型选择是可处理的。具体而言,它展示了四种不同情况下序列标注和依赖解析模型之间的结构知识蒸馏的可处理性和实际有效性。