关于用袋、组和集合进行分类的研究

Jun, 2014

关于用袋、组和集合进行分类的研究

On Classification with Bags, Groups and Sets

Veronika Cheplygina, David M. J. Tax, Marco Loog

TL;DR本文总结了针对集合特征向量数据集的基于监督学习的多种拓展方法，并提出了一种分类法以展示它们之间的关系，并讨论了未来的研究方向。

Abstract

Many classification problems can be difficult to formulate directly in terms of the traditional supervised setting, where both training and test samples are individual feature vectors. There are cases in which samples are better described by sets of →

supervised learning set-based classification taxonomy feature vectors independent labels

发现论文，激发创造

基于统一框架的集合分类概述

通过一个统一的统计框架来回顾多种基于集合值分类的公式，提供了可扩展的策略和构建数据驱动算法的方法，并在真实数据集上进行实验和提供一般的实用指导。

Feb, 2021

基于差异性的多实例学习集成

本文提出了一种介于使用相似性和原型实例之间的、将它们各自的特点结合起来的方法，并使用随机子空间集合来设计分类器以实现在多实例学习问题上的最先进性能。

Feb, 2014

使用 Bagging SVM 从正样本和未标记样本中学习

我们研究了从标记为正例和未标记样本的训练集中学习二元分类器的问题，提出了一种袋装方法来应对这个问题，并在模拟和实际数据上进行了实证表明。

Oct, 2010

从群体统计数据中了解个体

本研究提出了一种新的问题形式，解决了二进制多实例学习问题，并创建了一个基于概率的模型，通过有效的 MCMC 算法进行训练，利用组统计信息来学习实例级分类器，以推断个体的未知二进制标签。该模型在一般对象识别中得到了应用。

Jul, 2012

球场学习：从粗略的组间比较中估算标签

利用约束比例而非标注样本估算标签的研究，对应用真实环境、情感分析和探索性分析二者进行了强力演示。

Jun, 2016

深度集合预测网络

提出一种针对无序集合的预测模型，解决了现有方法忽视集合结构和存在的不连续性问题，通过单个特征向量可实现点集的自编码、图像中物体边框的预测以及物体属性集合的预测。

Jun, 2019

从聚合数据中学习：编辑包和随机包的比较

本文探讨了使用聚合的数据标签训练机器学习模型的可行性，并针对策展袋和随机袋进行了两种自然聚合过程的研究。在策展袋设置下，通过使用聚合标签计算损失函数的梯度，证明我们可以实现不降低性能的基于梯度的训练。在随机袋设置下，基于 Rademacher 复杂度提供了一种广义风险边界，并展示了如何通过经验风险最小化进行正则化以实现最小风险界限，我们的实验结果表明，聚合学习可以有效地保护用户隐私并保持模型精度。

May, 2023

从标签比例进行深度多类学习

该研究提出了一种学习算法，可以从标签比例中学习而不是直接数据标签，并比较了两种不同的可微损失函数来训练端到端的深度神经网络从图像所在的袋子中学习精确的图像分类器。

May, 2019

基于包的不相似性的多示例学习

本文提出了一种基于袋之间的不相似性的向量表示方法，用于多实例学习中的学习和分类，这种方法在多个 MIL 数据集上都具有与最先进算法相当的性能，计算代价较小。

Sep, 2013

一种用于数据集级应用的原型汇聚表示法

本研究提出了一种基于样本原型聚类的数据集向量化方法，即包含语义原型的数据集级词袋模型，可用于评估数据集的适用性和测试集的难度，并且在不考虑数据集标签的情况下，与 Jensen-Shannon divergence 相结合，有效地衡量数据集之间的相似性。

Mar, 2023