May, 2023

基于逻辑回归的集成分布蒸馏用于鲁棒性自回归序列不确定性

TL;DR本研究考察了在大规模自然语言序列到序列数据中应用 Ensemble Distribution Distillation (EDD)来压缩昂贵的集成模型的优越性能为成本较低的单一模型的有效性,既能够分离知识(认识不一致性)和数据(随机数据)不确定性,还能解决大词汇量数据的复杂性,并在非分布式检测中表现出色。