BriefGPT.xyz
大模型
Ask
alpha
关键词
pretrained summarizers
搜索结果 - 1
文本摘要的嘈杂自知力蒸馏
本文将自我知识蒸馏应用到文本摘要中,通过引入教师模型生成平滑标签以帮助正则化训练,同时使用多个噪声信号来更好地模拟不确定性,实验结果显示该框架提高了预先训练和非预先训练摘要器的性能,并达到了最先进的结果。
PDF
4 years ago
Prev
Next