BriefGPT.xyz
Ask
alpha
关键词
autoregressive sequence tasks
搜索结果 - 1
基于逻辑回归的集成分布蒸馏用于鲁棒性自回归序列不确定性
本研究考察了在大规模自然语言序列到序列数据中应用 Ensemble Distribution Distillation (EDD)来压缩昂贵的集成模型的优越性能为成本较低的单一模型的有效性,既能够分离知识(认识不一致性)和数据(随机数据)不
→
PDF
a year ago
Prev
Next