平衡偏倚和方差的主动弱监督学习

KDDJun, 2022

平衡偏倚和方差的主动弱监督学习

Balancing Bias and Variance for Active Weakly Supervised Learning

Hitesh Sapkota, Qi Yu

TL;DR提出了一个新颖的主动式深度多实例学习方法，该方法采样少量信息实例进行注释，旨在显著提高实例级预测。通过设计方差正则化损失函数来平衡实例级别预测的偏差和方差，以便有效控制多实例学习中高度不平衡的实例分布及其他基本挑战，并通过分布鲁棒的袋级似然作为其凸替代，使得其能够平衡偏差和方差，通过强大的理论保证提供方差基于 MIL 损失的良好近似。然后，将该鲁棒性袋似然与深度体系结构自然集成，以支持使用正负袋对的小批量进行深度模型训练。最后，开发了一个结合概率向量和预测实例得分的新型 P-F 采样函数，可以探索最具挑战性的袋并有效地检测其正实例进行注释，从而显著改进实例级预测。多个真实世界数据集上的实验清楚地证明了该模型所达到的最先进实例级预测性能。

Abstract

As a widely used weakly supervised learning scheme, modern multiple instance learning (MIL) models achieve competitive performance at the bag level. However, instance-level prediction, which is essential for many important applications, remains largely unsatisfactory. We propose to con

active deep multiple instance learning variance regularized loss function distributionally robust bag level likelihood p-f sampling function instance-level prediction

发现论文，激发创造

通过变分自编码器进行多实例特征深度学习

提出了一种结合了判别和生成模型，基于弱监督深度学习的新型深度学习框架，用于解决多示例学习中来自于正实例标签不确定性的挑战，并成功应用于音频事件检测和分类任务中，相对以往的研究成果表现更优，具有良好的可扩展性。

Jul, 2018

具有消除混杂层次预测数据干扰的干预式多实例学习

该研究提出了一种新颖的干预型多实例学习（IMIL）框架，并通过因果干预设计期望最大化（EM）算法来实现训练过程中的强大实例选择以及抑制袋子上下文先验引起的偏差。实验表明，IMIL 方法可以显著减少误报，并优于现有 MIL 方法。

Apr, 2022

ProMIL：面向医学成像的概率多示例学习

本研究提出了一种基于深度神经网络和 Bernstein 多项式估计的专用实例方法 ProMIL 来解决多实例学习中标签分配问题，并证明其在医学应用方面胜过标准基于实例模型。

Jun, 2023

PDL：使用渐进丢弃层对多实例学习进行规范化

本研究提出了一种新的正则化方法，即渐进性丢失层（PDL），旨在解决弱监督学习中过拟合问题，并增强多实例学习模型在发现复杂和有影响力的特征表示方面的能力。通过在多个多实例学习方法中集成 PDL，我们在各种基准数据集上进行了广泛的评估，结果显示 PDL 的整合不仅提高了分类性能，还增强了模型进行弱监督特征定位的潜力。

Aug, 2023

对于全幅图像分类，重新考虑多实例学习：你只需要一个良好的实例分类器

本文提出了一种基于对比学习和原型学习的实例级 MIL 框架，旨在有效完成实例分类和包分类任务，并提出了通过原型学习生成精确伪标签的方法。在四个数据集上的广泛实验和可视化证明了我们方法的强大性能。

Jul, 2023

基于注意力机制的深度多示例学习

本文提出了一种基于神经网络的置换不变聚合运算符，并展示了其在多个 MIL 数据集上的实验表现，特别是在两个真实组织病理学数据集上的表现，同时保持了可解释性。

Feb, 2018

多实例学习：问题特征和应用综述

本文综合研究了不同类型的多实例学习问题的特点，并提供了解决每一类问题的方法，考察了这些特征在关键应用领域中的体现，最后通过实验比较了 16 种最先进的算法在所选问题特征上的性能。

Dec, 2016

任意假设类的多示例学习

本文提出了一种新的基于 PAC 学习的算法来处理多实例学习中的分类问题，并进行了理论分析，证明了这种算法的样本复杂度仅与背包的大小呈对数关系。

Jul, 2011

利用神经网络形式主义解决多实例问题

本文提出了一种基于神经网络的多实例学习技术，在 14 个公开基准数据集上进行了八种分类器的比较，结果表明该技术可以有效地优化和发现袋子中的未知模式

Sep, 2016

主动学习的方差最大化准则

提出了一种新的主动学习方法 MVAL，通过评估下一个待查询样本和其潜在标记的变化引起的输出变量的变化率来测量未标记实例的价值，并利用信息矩阵来跟踪这些输出分数，通过融合方差来选择既具有信息性又代表性的示例。与逻辑回归和支持向量机相结合，表现出与同类算法相比的最先进性能。

Jun, 2017