对含噪网络数据的类别级监督学习

Mar, 2018

对含噪网络数据的类别级监督学习

Learning from Noisy Web Data with Category-level Supervision

Li Niu, Qingtao Tang, Ashok Veeraraghavan, Ashu Sabharwal

TL;DR本文提出了一种利用变分自编码器（VAE）和类别级别监督来处理网络数据的方法，并在三个基准数据集上进行了实验证明其有效性。

Abstract

As tons of photos are being uploaded to public websites (e.g., Flickr, Bing, and Google) every day, learning from web data has become an increasingly popular research direction because of freely available web resources, which is also referred to as webly supervised learning. Neverthele

webly supervised learning label noise category-level supervision variational autoencoder benchmark datasets

发现论文，激发创造

群体参与：一种弱监督深度学习框架用于从 Web 数据中学习

本文介绍了一种鲁棒性强的、端到端的深度弱监督学习框架，该框架通过随机分组和注意力机制来有效减少 Web 图片注释的负面影响，实现了对嘈杂标签的有效抑制和准确图像标注，实验证明了该方法的卓越性能。

Nov, 2016

从嘈杂的网络视频中学习如何学习

本文提出了基于强化学习的标记策略，从嘈杂的网络搜索结果中选择正确的样本来训练分类器，以学习准确的视觉概念分类器。实验结果表明，我们的方法能够学习嘈杂数据的良好标记策略，并用此学习精确的视觉概念分类器。

Jun, 2017

CurriculumNet: 大规模网络图像弱监督学习

该论文提出了一种基于课程学习的弱监督学习方法，通过对大规模网络图像数据进行无人工标注的深度神经网络训练，实现对大量噪声数据和数据分布不均等问题的有效处理和噪声标签的负面影响的显著降低，构建一种新的课程学习架构，使得使用高噪声标签的图像作为一种正则化策略可以惊人地提高模型的泛化能力，在 WebVision、ImageNet、Clothing-1M 和 Food-101 等四个基准测试中取得了最先进的性能，多模型集成的结果在 1000 种类别分类中取得了 5.2% 的 top-5 错误率，相对误差率超过 50%。

Aug, 2018

从网络数据中学习：无监督目标定位的益处

本文研究了利用易获取的网络数据学习模型来辅助有标签数据集的细粒度图像分类。通过对 web 数据的处理包括对象定位和选择方法，本研究在降低数据分布差异的同时，优化了 CNNs 的训练，取得了良好的表现。

Dec, 2018

卷积网络的网络监督学习

本文提出了一种使用大量网络数据来学习 CNN 的方法。具体地，我们利用了课程学习的思想，提出了一种 CNN 训练的两步方法，表现优异且鲁棒性强。我们使用这种方法在 VOC 2007 上实现了最佳性能，并在其中演示了网络监督学习的强大功能。

May, 2015

从分类到分类器：通过探索网络实现仅基于名称的持续学习

通过利用互联网中的未经整理的数据，本论文探讨了使用仅有类别名称而无标注训练数据的新模式 name-only continual learning，在持续学习中解决手动标注数据的挑战。通过使用网络数据创建支持集，我们展示了与使用生成模型或从 LAION-5B 进行图像检索创建支持集的最新模型相比，准确度提升了 25%。由于使用未经整理的数据可以缓解手动数据标注的挑战，我们的方法在各种持续学习场景中始终表现出小幅度的性能差距。创造了一个用于捕捉实际趋势的类增量数据集 EvoTrends，仅需几分钟即可创建。

Nov, 2023

基于数据驱动的元集合细粒度视觉分类

通过学习元数据集并应用数据驱动的元集合方法，我们可以解决使用网络图像进行细粒度图像识别时带有标签噪声的问题，并且相比于现有噪声鲁棒性方法，我们的方法要优越得多。

Aug, 2020

WebVision 数据库：从网络数据中进行视觉学习和理解

本研究基于收集自网络的大规模嘈杂数据对学习视觉识别模型进行了探究。我们构建了一个名为 WebVision 的新数据库，其中包含了超过 240 万张与 ILSVRC 2012 基准数据集的 1,000 个语义概念相关的查询生成的网络图像，并收集了元信息（例如标题，描述，标签等）。通过这个数据库，我们发现网络图像可以用于训练良好的深度 CNN 模型，且该模型的泛化能力甚至优于 ILSVRC 2012 数据集训练的模型。此外，我们也发现了一个数据集偏见问题，即在视觉领域自适应方面存在一些问题。这个新的 WebVision 数据库及其相关研究对于利用网络数据最小化监督学习最先进的视觉模型具有重要的价值。

Aug, 2017

WebSeg：从网络搜索中学习语义分割

本文提出一种能够无需依赖显式用户注释的 Flickr 图像，通过利用一些低级线索（如显著性、边缘等）生成代理标签，并使用在线标签噪声过滤辅助模块来帮助协助分割网络学习更干净的代理注释进行语义分割。在 PASCAL VOC 2012 语义分割基准测试中，该算法表现出色，WebSeg (mIoU = 57.0%) 和弱监督 (mIoU = 63.3%) 的设置。

Mar, 2018

从互联网提取视觉知识：理解图像数据

本研究针对视觉识别技术中的特征表示、学习算法和标记的训练数据进行了探究，提出了一种基于网络监督的自动图像数据生成方法，以实现对大量视觉概念的高效训练和识别。在 Pascal VOC 2007 数据集上对该方法进行了测试，并取得了明显的优越性能。

Jun, 2019