Sep, 2020

文本摘要的嘈杂自知力蒸馏

TL;DR本文将自我知识蒸馏应用到文本摘要中,通过引入教师模型生成平滑标签以帮助正则化训练,同时使用多个噪声信号来更好地模拟不确定性,实验结果显示该框架提高了预先训练和非预先训练摘要器的性能,并达到了最先进的结果。