间接监督信号下的可学习性

Jun, 2020

Learnability with Indirect Supervision Signals

Kaifu Wang, Qiang Ning, Dan Roth

TL;DR本文提出了一个统一的理论框架，用于处理多类分类的问题，其中监督由包含零互信息的变量提供，这个问题的性质由金标签到间接监督变量的转移概率和学习者对转移的先验知识决定，我们的理论引入了一个称为分离的新概念，描述学习能力和泛化界限，并在一系列学习场景中展示了该框架的应用。

Abstract

Learning from indirect supervision signals is important in real-world AI applications when, often, gold labels are missing or too costly. In this paper, we develop a unified theoretical framework for multi-class classif

indirect supervision mutual information multi-class classification transition probability generalization bounds

发现论文，激发创造

附带监督：超越监督式学习

通过多种设计好的学习范式来缓解监督瓶颈，以在文本中诱导各种语义表征，从而帮助决策，减少生成必要的监督信号导致的代价和不可扩展的问题。

May, 2020

监督信号信息化程度的研究

通过对比学习和分类等几种常用的监督信号的信息论分析，我们确定了它们如何为表示学习性能做出贡献以及在训练数据集的标签数、类数和维数等培训参数影响下学习动力学如何受影响。我们通过一系列模拟实验进行了实证验证，并进行了成本效益分析，以建立一条权衡曲线，使用户能够优化在自己的数据集上监督表示学习的成本。

Nov, 2022

间接观测中的学习

本文提出了一种基于概率框架的弱监督学习方法，通过最大似然原则，利用多种弱监督信号（例如嘈杂标签和粗粒度标签等）进行学习，使用 true target 的一个鉴别性模型来建模间接观察，并利用随机变量最大化似然度来隐式地进行真实目标的估计，该方法可直接用于深度神经网络中。

Oct, 2019

通过弱间接监督创建训练集

该研究论文提出了 Weak Indirect Supervision (WIS) 这一问题，还设计了一种基于概率建模的 PLRM 方法来解决监督数据输出空间不匹配的问题。PLRM 方法在图像分类、文本分类和工业广告应用中均表现出超过基线模型 2% ~ 9% 的优势。

Oct, 2021

利用多实例弱监督学习潜在模型

本文针对监督信号由多输入实例上的标签的转移函数 σ 生成的弱监督学习方案，提出了多实例偏标签学习（multi-instance PLL）问题，并给出了对于可能的未知转移 σ 的第一理论分析。通过使用一种在神经符号学中广泛使用的顶部 - k 替代损失，我们推导了基于 Rademacher 的错误界限，并进行了实证实验。

Jun, 2023

从聚合观察中学习

本文提出了一个概率框架，将多实例学习扩展到多类分类和回归等其他问题，并引入一种新的一致性概念来表征估计器，证明了在温和的假设下具有良好的收敛性。实验证明，该方法在三种问题设置中具有有效性。

Apr, 2020

通过观察学习路径获取更好的监督信号

本文提出了一种新的知识蒸馏方案，Filter-KD，通过观察模型的学习路径来解释现有的标签平滑和知识蒸馏方法，并发现模型可以通过 “锯齿形” 学习路径自发地改善 “糟糕” 的标签，从而提高下游分类性能。

Mar, 2022

利用线性矩估计间接监督

为解决间接监督问题中最大边缘似然性面临的两个计算障碍，本文提出了一种基于线性系统求解特定模型的充分统计量的方法，从而通过凸优化来估算参数。同时，本文阐述了该方法的统计特性，并通过在本地隐私约束条件和低成本计数注释双方面的实验表明了该方法的有效性。

Aug, 2016

不充分和不正确监督下的学习

本文提出了一种新颖的半监督学习范式，旨在解决标签不足和标签不准确的问题，该方法使用图来连接数据点以便在图边沿将标签信息从稀少标记示例传播到未标记的示例。实验证明，该方法在图像分类、文本分类和语音识别等领域有效降低标签误差，表现优于其他现有的半监督学习方法。

Feb, 2019

半监督学习中的信息论方法在协变量偏移下的应用

该研究提出了一种用于半监督学习在数据集分布改变的情景下的新方法，基于信息理论，该方法包括了当前流行的熵最小化和伪标签方法，提出了一些新的上界描述其泛化误差情况，其在数据集分布改变的情景下胜过之前提出的方法。

Feb, 2022