ACLJun, 2023

预训练语言模型中的基于决策的知识蒸馏中决策和逻辑之间的桥梁

TL;DR研究新的决策 KD 技术,从决策分布中估算出 logits,同时将理论和实验方法相结合,提高了自然语言理解和机器阅读理解性能。