无监督预训练有助于保留来自输入分布的视角

ICMLMay, 2019

无监督预训练有助于保留来自输入分布的视角

Unsupervised pre-training helps to conserve views from input distribution

Nicolas Pinchaud

TL;DR本文研究无监督预训练方法对信息理论的影响，当输入分布显示出多个监督视图时，该方法可以学习层次化表示，并确保学到的特征在条件标签下独立。无监督预训练可以帮助解决过拟合问题，并提出了一种实用方法来评估监督解缠和二进制特征中的多个视图数量。相比之下，使用有监督模型的学习表示法会忽略大部分视图。

Abstract

We investigate the effects of the unsupervised pre-training method under the perspective of information theory. If the input distribution displays multiple views of the supervision, then →

unsupervised pre-training conditional independence hierarchical representation disentanglement of supervision information theory

发现论文，激发创造

无监督学习中解开表征的常见假设的挑战

本文分析了无监督学习分离表示的最新进展并挑战了一些常见假设，通过实验研究发现，不加监督训练的模型很难达到良好的分离效果，同时，增加分离度似乎不会降低学习的样本复杂度，未来的研究应该关注归纳偏置和 (隐式) 监督的作用，考虑在多个数据集上复现实验结果。

Nov, 2018

监督学习中高效表示识别

本文针对非线性独立成分分析的负面结果，试图研究在没有条件独立性的辅助信息下如何实现解缠以及如何减少需要的辅助信息量。在一类模型中，我们证明理论上和实验上都可以实现解缠，即使辅助信息的维度远小于真实潜在表示的维度。

Apr, 2022

关于非监督学习解耦表示及其评价的冷静观察

本文提供了对无监督学习解开重要变动因素的最新发展的观点，旨在挑战一些常见的假设。本文首先从理论上证明了，无监督的解开表示恒妄图反演和数据上的约定性偏见是不可能的。接着，通过对 8 个数据集进行超过 14,000 个模型的训练，本文发现虽然不同的方法成功地实现了相应损失所鼓励的特性，但是没有监督的情况下，好的解开模型似乎无法被识别。此外，不同的评估指标并不总是在什么应该被认为是 “解开的” 上达成一致，而且在估计上表现出系统性差异。最后，增加的解开性似乎并不一定会导致学习下游任务的样本复杂度减少。本文的结果表明，关于解开学习的未来工作应该明确归因于诱导偏见和（隐含的）监督的作用，研究解开表示的具体好处，并考虑到涵盖几个数据集的可重复的实验设置。

Oct, 2020

监督预训练的可迁移性再探究：基于多层感知器的视角

这篇论文研究了预训练模型下的无监督预训练与监督预训练的可迁移性差异，并提出了利用多层感知器解决可迁移性问题的方法，实验证明，在监督预训练模型中加入多层感知器可使模型的可迁移性显著提高，使得监督学习下的预训练能够与无监督学习相媲美或者更优秀。

Dec, 2021

对比学习的好视角是什么？

这篇论文研究不同视角之间的关联性对于对比学习在无监督和半监督任务中的重要性，并提出通过减少视角之间的互信息来学习有效的视角以提高下游任务的准确性。同时，作者在 ImageNet 分类和 PASCAL VOC 目标检测以及 COCO 实例分割任务上通过对比实验展示了他们提出方法的高效性。

May, 2020

使用少量标签解开变异因素

针对学习解耦表示是表示学习中重要的问题，本文调查研究了少量监督如何影响现有的解耦学习方法，并进行了大规模实验，结果表明，即使标签不完全或不准确，使用少量的标记训练样本可以对现有的解耦学习模型进行模型选择，并证实引入监督可以有效地学习解耦表示。

May, 2019

多视角自监督学习

本文提供了一种信息理论框架，从多个视角探究自监督学习的特性，并介绍了可以丢弃任务无关信息的任务相关自适应目标函数，为自监督学习的目标设计提供了更加广阔的空间。

Jun, 2020

无损弱监督解缠编

该论文指出只需要知道环境中有多少因素发生了变化，而不必了解哪些因素发生了变化，就足以学习到分离的表征，同时实验表明，这种弱监督方式足以在多个基准数据集上可靠地学习到分离的表征，并在多个任务上发挥作用，包括协变量漂移下的一般化、公平性和抽象推理。

Feb, 2020

无监督预训练的泛化能力研究

运用一种新的理论框架，研究无监督预训练对细调模型泛化能力的影响，并通过分析两个具体场景的泛化上限，提出了一种新的预训练正则化方法，从而促进了细调模型的泛化能力。

Mar, 2024

带保证的弱监督解缠模型

研究了当领域匹配、限定标签、匹配对和 rank-pairing 等弱监督方法与基于分布匹配的学习算法相结合时，弱监督何时以及如何保证解缠缚表示的理论框架及其保证和局限性，并通过实验证明了我们理论框架的预测能力和有用性。

Oct, 2019