BriefGPT.xyz
大模型
Ask
alpha
关键词
rote learning
搜索结果 - 3
自回归语言模型的知识蒸馏再探讨
通过分析发现大型语言模型在教学学生模型时会导致性能下降,设计了一种自适应教学方法(ATKD)来改进知识蒸馏,并通过大量实验验证其在各种模型类型和规模上均能显著提高性能(平均得分增加至多 + 3.04%)。更重要的是,ATKD 能有效改善学生
→
PDF
4 months ago
EMNLP
词汇重复导致机械记忆:揭示训练和测试参考摘要中词汇重叠的影响
理想的摘要模型应该能推广到新的值得摘要的内容,而不需要死记参考训练摘要,我们提出了一种细粒度的评估协议,通过基于参考测试摘要与训练摘要之间的词汇相似性将测试集划分,限制训练摘要中的词汇重复能够防止死记硬背,并提高摘要模型的泛化性。
PDF
8 months ago
基于 ASP 的 ABA 学习
最近,提出了 ABA 学习作为一种从背景知识、正负样本中绘制基于假设的论证框架的符号机器学习方法。我们提出了一种使用答案集规划来实现 ABA 学习的新方法,以帮助指导 ABA 学习中的死记硬背和泛化。
PDF
10 months ago
Prev
Next