没有一种表示能够掌握所有知识：训练方法的重叠特征

Oct, 2021

没有一种表示能够掌握所有知识：训练方法的重叠特征

No One Representation to Rule Them All: Overlapping Features of Training Methods

Raphael Gontijo-Lopes, Yann Dauphin, Ekin D. Cubuk

TL;DR通过对超参、架构、框架和数据集进行大规模实证研究，我们发现训练方法的差异会导致模型产生不同的泛化行为，从而在子域中表现更好，与其他模型的错误更不相关。这种多样性可以提高集成表现，并且连低准确度的模型也可以用来提高高准确度的模型。此外，我们发现训练方法的差异会使表示捕捉到有重叠但不是超集的特征集，将其结合可以提高下游性能。

Abstract

Despite being able to capture a range of features of the data, high accuracy models trained with supervision tend to make similar predictions. This seemingly implies that high-performing models share similar biases regardless of training methodology, which would limit ensembling benefi

supervised learning contrastive learning ensemble performance training methodology generalization behavior

发现论文，激发创造

探索新的方法：强调表征差异性以学习新特征并减少误差一致性

利用表征相似性领域的方法，提出了一种新颖的想法，在训练期间推动中间表示在不同架构之间的深度上不同，以学习具有不同故障模式的鲁棒集成模型。结果表明，高度不相似的中间表示导致较低的相关性输出预测及稍微降低的错误一致性，并提高了集成模型的准确性。

Jul, 2023

局部独立预测模型集合

本文通过介绍新的多样性度量方法介绍了一种新的模型集成方法，该方法特别适用于数据限制和协变量转移，可显著提高模型的多样性和泛化性能。

Nov, 2019

在对抗性环境下重新审视集成：提高自然精度

为了提高深度学习模型在实际应用中对小型对抗扰动的抵抗力和非恶意输入的准确性，我们考虑了一些集成方法，关键洞见在于训练模型以抵御小型攻击的模型在集成时可以承受更大的攻击，并且可以通过这个概念来优化自然准确性。我们考虑了两种方案，一种是从几个随机初始化的强韧模型中组合预测，另一种则是将强韧模型和标准模型的特征进行融合。

Feb, 2020

共同学习：不同神经网络是否学习相同表示？

本文研究了神经网络所谓的收敛学习现象，使用多种技术对神经网络进行了实验，发现了一些神经网络的未知属性，包括神经网络中某些特征通常会被成功学习，而其他特征则没有被可靠地学习，单元学习低维子空间，而这些子空间是多个网络共有的，但学习的基向量不一致，表示代码表现出局部代码和略微分布式代码的混合特征。

Nov, 2015

不走捷径：基于集成的方法避免已知数据集偏差

本文提出了一种训练出更具有领域迁移鲁棒性的模型的方法，通过训练一个简单模型以识别数据集偏差，再与鲁棒模型结合，使其更专注于数据集中更容易推广的模式。在五个具有领域迁移测试集的数据集上实验，结果显示在所有情况下都有显著改善，包括一个变化优先视觉问答数据集上的 12 点增益和一个对抗问答测试集上的 9 点增益。

Sep, 2019

为何多个网络头胜过单独一个：训练深度神经网络的多样集成

本研究探讨了如何最佳地建立卷积神经网络的组合，比较了多种资源共享和差异性鼓励的策略，其中提出了 TreeNets 算法，最后通过端到端的训练以统一的损失函数获得比传统算法更高的准确率。

Nov, 2015

重拾被遗忘的知识：关于遗忘、过拟合和无需训练的深度神经网络集成

在深度神经网络中，我们引入一种新的评分方法来衡量过拟合，该方法通过监测验证数据上的模型遗忘率，从而揭示了即使总体上泛化能力得到改善，仍存在数据空间中某些区域泛化能力退化的情况。基于这些观察，我们构建了一种新的集成方法，该方法仅基于单个网络的训练历史，在不增加额外训练时间的情况下显著提高了性能。在现代深度模型上进行的广泛实证评估显示了该方法在多个数据集、神经网络架构和训练方案中的实用性，无论是从头开始训练还是在迁移学习中使用预训练网络。值得注意的是，我们的方法在实现和使用上更加简单，并在 Imagenet 上改进了具有竞争力的网络 1% 的性能。

Oct, 2023

探索集成方法提高文本分类器模型鲁棒性

本文通过分析一系列偏置特征并证明没有单一的模型适用于所有情况来改善模型的鲁棒性，进一步表明通过选择合适的偏置模型，我们可以获得比更复杂的模型设计基准更好的鲁棒性结果。

Oct, 2022

鲁棒性可能与准确性相矛盾

我们证明了，追求对抗鲁棒性和标准泛化之间存在固有的紧张关系，训练鲁棒性模型不仅可能更加费时，也会导致标准准确性的降低，并且这种现象是由于鲁棒分类器学习了根本不同的特征表示方法。

May, 2018

同一领域内的视觉表示学习无法进行强泛化

通过对 17 种无监督，弱监督和完全监督的表征学习方法进行测试，本文观察到这些模型对于简单数据集中存在的发生因素都无法正确学习机制，且随着测试数据集的现实性增强，它们的泛化能力显著下降。

Jul, 2021