球场学习：从粗略的组间比较中估算标签

KDDJun, 2016

球场学习：从粗略的组间比较中估算标签

Ballpark Learning: Estimating Labels from Rough Group Comparisons

Tom Hope, Dafna Shahaf

TL;DR利用约束比例而非标注样本估算标签的研究，对应用真实环境、情感分析和探索性分析二者进行了强力演示。

Abstract

We are interested in estimating individual labels given only coarse, aggregated signal over the data points. In our setting, we receive sets ("bags") of unlabeled instances with constraints on label proportions. We relax the unrealistic assumption of known label proportions, made in previous work; instead, we assume only to have upper and lower bounds, and c

label estimation proportion constraints unsupervised learning sentiment analysis exploratory analysis

发现论文，激发创造

从标签比例进行深度多类学习

该研究提出了一种学习算法，可以从标签比例中学习而不是直接数据标签，并比较了两种不同的可微损失函数来训练端到端的深度神经网络从图像所在的袋子中学习精确的图像分类器。

May, 2019

基于标签比例的文本分类学习

在隐私设置和弱监督下，我们提出了一种新的基线技术 DLLP 的不规则性，以及与 LLP 下的通用性边界争论相结合的基于自我监督目标的新公式，该方法在 87% 的实验配置中比基线模型取得更好的结果，实验涵盖了长篇和短篇文本的大规模模型，并使用多个度量标准进行评估。

Oct, 2023

使用深度学习从标签比例进行人口分类的共同训练

本文介绍了一种在无标注训练样本的情况下，通过使用深度神经网络，并引入一种新正则化层 Batch Averager，将有标注数据的深度神经网络转换为无标注学习（LLP）的方法。本文还提出了一种协同训练算法，以支持可能由图片和文本组成的数据域。作者通过 Twitter 用户的 tweets 和个人资料图片，预测 Twitter 用户的性别和种族 / 民族信息，并发现深度 LLP 方法在文本和图片分类方面均优于基线方法，并且协同训练算法可以将文本和图片分类的绝对 F1 值分别提高 4％和 8％。最后，采用文本和图片分类器的集合进一步平均提高了绝对 F1 值 4％。

Sep, 2017

从群体统计数据中了解个体

本研究提出了一种新的问题形式，解决了二进制多实例学习问题，并创建了一个基于概率的模型，通过有效的 MCMC 算法进行训练，利用组统计信息来学习实例级分类器，以推断个体的未知二进制标签。该模型在一般对象识别中得到了应用。

Jul, 2012

如何评估公平度？无标签数据和贝叶斯推断的公平度度量信任性评估

使用贝叶斯框架对少量带有标签的数据进行无标签数据增强，以更准确低偏差的方式评估群组公平问题，鉴于标签样本，我们提议使用一种层次潜在变量模型，估计每组未标记样本的校准得分，并证明了我们的方法在多个公平数据集，敏感属性和预测模型中具有显著的一致的估计误差降低，表明了使用无标签数据和贝叶斯推理的好处来评估预测模型的公平性。

Oct, 2020

从无标签数据估算准确性：一种概率逻辑方法

我们提出了一种基于逻辑约束的多类别分类器准确度无标签估计方法，尝试使用基于分类器之间一致性的逻辑关系的猜想，从而得出准确估计值，实验证明了此方法在四个真实数据集上的有效性。

May, 2017

MixBag: 标签比例学习的包级数据增强

提出了一种基于袋级数据增强的学习方法 MixBag，该方法可应用于实例级数据增强技术和使用比例损失的任何学习方法，并通过实验证明了其优势和有效性。

Aug, 2023

有限标记资源下的分类器风险评估

该研究提出了基于分层取样的策略来选取测试集的子集进行标注，以尽可能准确地估计分类器的性能，相对于简单随机取样，这些策略可以显著减少分类器精度估计中方差的误差，并且在有限标注资源下比随机取样需要更少的样本来估计分类器的准确性，有些情况下减少的样本数量高达 60％。

Jul, 2016

学习标签比例

该文章针对基于 Label Proportions 的学习环境提出了一个新的学习框架 ——Empirical Proportion Risk Minimization，利用该学习框架可以构建更好的学习算法，在政治学、营销、医疗保健和计算机视觉等领域有广泛应用。

Feb, 2014

通过信念传播引导超级学习者的标签比例学习

通过学习标签比例 (LLP)，我们提出了一种新的算法框架，其中迭代地执行伪标签和嵌入改进两个主要步骤，利用 Gibbs 分布和 Belief Propagation，在不牺牲计算效率的情况下，取得了标签比例学习问题上的显著改进。

Oct, 2023