球场学习:从粗略的组间比较中估算标签
该研究提出了一种学习算法,可以从标签比例中学习而不是直接数据标签,并比较了两种不同的可微损失函数来训练端到端的深度神经网络从图像所在的袋子中学习精确的图像分类器。
May, 2019
在隐私设置和弱监督下,我们提出了一种新的基线技术 DLLP 的不规则性,以及与 LLP 下的通用性边界争论相结合的基于自我监督目标的新公式,该方法在 87% 的实验配置中比基线模型取得更好的结果,实验涵盖了长篇和短篇文本的大规模模型,并使用多个度量标准进行评估。
Oct, 2023
本文介绍了一种在无标注训练样本的情况下,通过使用深度神经网络,并引入一种新正则化层 Batch Averager,将有标注数据的深度神经网络转换为无标注学习(LLP)的方法。本文还提出了一种协同训练算法,以支持可能由图片和文本组成的数据域。作者通过 Twitter 用户的 tweets 和个人资料图片,预测 Twitter 用户的性别和种族 / 民族信息,并发现深度 LLP 方法在文本和图片分类方面均优于基线方法,并且协同训练算法可以将文本和图片分类的绝对 F1 值分别提高 4%和 8%。最后,采用文本和图片分类器的集合进一步平均提高了绝对 F1 值 4%。
Sep, 2017
本研究提出了一种新的问题形式,解决了二进制多实例学习问题,并创建了一个基于概率的模型,通过有效的 MCMC 算法进行训练,利用组统计信息来学习实例级分类器,以推断个体的未知二进制标签。该模型在一般对象识别中得到了应用。
Jul, 2012
使用贝叶斯框架对少量带有标签的数据进行无标签数据增强,以更准确低偏差的方式评估群组公平问题,鉴于标签样本,我们提议使用一种层次潜在变量模型,估计每组未标记样本的校准得分,并证明了我们的方法在多个公平数据集,敏感属性和预测模型中具有显著的一致的估计误差降低,表明了使用无标签数据和贝叶斯推理的好处来评估预测模型的公平性。
Oct, 2020
我们提出了一种基于逻辑约束的多类别分类器准确度无标签估计方法,尝试使用基于分类器之间一致性的逻辑关系的猜想,从而得出准确估计值,实验证明了此方法在四个真实数据集上的有效性。
May, 2017
提出了一种基于袋级数据增强的学习方法 MixBag,该方法可应用于实例级数据增强技术和使用比例损失的任何学习方法,并通过实验证明了其优势和有效性。
Aug, 2023
该研究提出了基于分层取样的策略来选取测试集的子集进行标注,以尽可能准确地估计分类器的性能,相对于简单随机取样,这些策略可以显著减少分类器精度估计中方差的误差,并且在有限标注资源下比随机取样需要更少的样本来估计分类器的准确性,有些情况下减少的样本数量高达 60%。
Jul, 2016
该文章针对基于 Label Proportions 的学习环境提出了一个新的学习框架 ——Empirical Proportion Risk Minimization,利用该学习框架可以构建更好的学习算法,在政治学、营销、医疗保健和计算机视觉等领域有广泛应用。
Feb, 2014
通过学习标签比例 (LLP),我们提出了一种新的算法框架,其中迭代地执行伪标签和嵌入改进两个主要步骤,利用 Gibbs 分布和 Belief Propagation,在不牺牲计算效率的情况下,取得了标签比例学习问题上的显著改进。
Oct, 2023