ACLJun, 2023
预训练语言模型中的基于决策的知识蒸馏中决策和逻辑之间的桥梁
Bridging the Gap between Decision and Logits in Decision-based Knowledge Distillation for Pre-trained Language Models
Qinhong Zhou, Zonghan Yang, Peng Li, Yang Liu
TL;DR研究新的决策 KD 技术,从决策分布中估算出 logits,同时将理论和实验方法相结合,提高了自然语言理解和机器阅读理解性能。