Jun, 2014
关于用袋、组和集合进行分类的研究
On Classification with Bags, Groups and Sets
Veronika Cheplygina, David M. J. Tax, Marco Loog
TL;DR本文总结了针对集合特征向量数据集的基于监督学习的多种拓展方法,并提出了一种分类法以展示它们之间的关系,并讨论了未来的研究方向。
Abstract
Many classification problems can be difficult to formulate directly in terms
of the traditional supervised setting, where both training and test samples are
individual feature vectors. There are cases in which samples are better
described by sets of →
发现论文,激发创造
使用 Bagging SVM 从正样本和未标记样本中学习
我们研究了从标记为正例和未标记样本的训练集中学习二元分类器的问题,提出了一种袋装方法来应对这个问题,并在模拟和实际数据上进行了实证表明。
Oct, 2010
从群体统计数据中了解个体
本研究提出了一种新的问题形式,解决了二进制多实例学习问题,并创建了一个基于概率的模型,通过有效的 MCMC 算法进行训练,利用组统计信息来学习实例级分类器,以推断个体的未知二进制标签。该模型在一般对象识别中得到了应用。
Jul, 2012
从聚合数据中学习:编辑包和随机包的比较
本文探讨了使用聚合的数据标签训练机器学习模型的可行性,并针对策展袋和随机袋进行了两种自然聚合过程的研究。在策展袋设置下,通过使用聚合标签计算损失函数的梯度,证明我们可以实现不降低性能的基于梯度的训练。在随机袋设置下,基于 Rademacher 复杂度提供了一种广义风险边界,并展示了如何通过经验风险最小化进行正则化以实现最小风险界限,我们的实验结果表明,聚合学习可以有效地保护用户隐私并保持模型精度。
May, 2023
从标签比例进行深度多类学习
该研究提出了一种学习算法,可以从标签比例中学习而不是直接数据标签,并比较了两种不同的可微损失函数来训练端到端的深度神经网络从图像所在的袋子中学习精确的图像分类器。
May, 2019
基于包的不相似性的多示例学习
本文提出了一种基于袋之间的不相似性的向量表示方法,用于多实例学习中的学习和分类,这种方法在多个 MIL 数据集上都具有与最先进算法相当的性能,计算代价较小。
Sep, 2013
一种用于数据集级应用的原型汇聚表示法
本研究提出了一种基于样本原型聚类的数据集向量化方法,即包含语义原型的数据集级词袋模型,可用于评估数据集的适用性和测试集的难度,并且在不考虑数据集标签的情况下,与 Jensen-Shannon divergence 相结合,有效地衡量数据集之间的相似性。
Mar, 2023