从集成学习中学习时，多样性非常重要

Oct, 2021

从集成学习中学习时，多样性非常重要

Diversity Matters When Learning From Ensembles

Giung Nam, Jongmin Yoon, Yoonho Lee, Juho Lee

TL;DR通过对集成方法进行扰动，可以增加模型多样性并提升性能。

Abstract

deep ensembles excel in large-scale image classification tasks both in terms of prediction accuracy and calibration. Despite being simple

deep ensembles image classification distillation calibration model diversity

发现论文，激发创造

集成分布蒸馏的通用框架

通过构建神经网络集成，可以更好地进行预测和不确定性估计，并将不确定性分解为数据不确定性和模型不确定性。本文提出了一种保持神经网络集成分解性质的蒸馏框架，其预测性能与标准蒸馏相当。

Feb, 2020

组合分布蒸馏

该论文提出了一种名为 EnD^2 的新方法，它使用 Prior Networks 对模型的输出分布进行建模，并使单个模型保留了集成模型减少计算成本和提高分类性能的同时，还能保留集合多样性的信息，用于估计不确定性。该方法不仅可适用于人工数据集，还取得了在 CIFAR-10、CIFAR-100 和 TinyImageNet 数据集上优于其他方法的成果。

Apr, 2019

深度学习中集成、知识蒸馏和自蒸馏的理解

探讨了深度学习模型集合如何提高测试准确率，以及如何使用知识蒸馏将集合的优越性能提取到单个模型中。并在此基础上，提出了一种新的理论，解释了在数据具有 “多视图” 结构的情况下，各自独立训练的神经网络集合确实可以明显提高测试准确率，而这种优越的效果也可以通过训练单个模型来匹配集合输出来证明，结果揭示了在深度学习中，集合模型以及 “黑暗知识” 是如何作用于知识蒸馏中的。最后，还证明了自身蒸馏也可以看作是隐式地组合集合模型和知识蒸馏以提高测试准确率。

Dec, 2020

局部独立预测模型集合

本文通过介绍新的多样性度量方法介绍了一种新的模型集成方法，该方法特别适用于数据限制和协变量转移，可显著提高模型的多样性和泛化性能。

Nov, 2019

Hydra：用于模型蒸馏的集合多样性保持技术

通过基于共享神经网络体的分布式方法 Hydra 来提取集合的多样性，分散集合的信息来提高模型收缩和泛化的性能.

Jan, 2020

EnsembleNet：多头模型的端到端优化

本研究通过提出更为简单有效的对应蒸馏架构，将单一深度神经网络转化为最优性能且规模更小的多头模型，提高机器学习模型的性能并实现端到端优化。

May, 2019

深度集成多样性用于外部分布检测的可用性

深度学习中用深度集成方法提升神经网络的鲁棒性能，在大规模图片数据集中使用互信息指标 (OOD）的检测效果比单一模型的熵指标要劣 30-40%，使用集成多个分类器的检测得分对 Deep Ensemble OOD 检测性能有着更好的提升表现。