WebVision 数据库：从网络数据中进行视觉学习和理解

Aug, 2017

WebVision 数据库：从网络数据中进行视觉学习和理解

WebVision Database: Visual Learning and Understanding from Web Data

Wen Li, Limin Wang, Wei Li, Eirikur Agustsson, Luc Van Gool

TL;DR本研究基于收集自网络的大规模嘈杂数据对学习视觉识别模型进行了探究。我们构建了一个名为 WebVision 的新数据库，其中包含了超过 240 万张与 ILSVRC 2012 基准数据集的 1,000 个语义概念相关的查询生成的网络图像，并收集了元信息（例如标题，描述，标签等）。通过这个数据库，我们发现网络图像可以用于训练良好的深度 CNN 模型，且该模型的泛化能力甚至优于 ILSVRC 2012 数据集训练的模型。此外，我们也发现了一个数据集偏见问题，即在视觉领域自适应方面存在一些问题。这个新的 WebVision 数据库及其相关研究对于利用网络数据最小化监督学习最先进的视觉模型具有重要的价值。

Abstract

In this paper, we present a study on learning visual recognition models from large scale noisy web data. We build a new →

learning visual recognition web data database domain adaptation

发现论文，激发创造

WebVision 挑战赛：基于网络数据的视觉学习与理解

2017 年 WebVision 挑战赛，旨在提供一组无需人工标记的互联网图像数据集和公开竞赛。数据集中包含超过 240 万张使用 ILSVRC 2012 语义概念生成的查询的互联网图像，用于在 WebVision 测试集上进行图像分类和在 PASCAL VOC 2012 数据集上进行迁移学习的任务。本文描述了数据收集与注释的详细信息、数据集的特点以及评估指标。

May, 2017

从互联网提取视觉知识：理解图像数据

本研究针对视觉识别技术中的特征表示、学习算法和标记的训练数据进行了探究，提出了一种基于网络监督的自动图像数据生成方法，以实现对大量视觉概念的高效训练和识别。在 Pascal VOC 2007 数据集上对该方法进行了测试，并取得了明显的优越性能。

Jun, 2019

卷积网络的网络监督学习

本文提出了一种使用大量网络数据来学习 CNN 的方法。具体地，我们利用了课程学习的思想，提出了一种 CNN 训练的两步方法，表现优异且鲁棒性强。我们使用这种方法在 VOC 2007 上实现了最佳性能，并在其中演示了网络监督学习的强大功能。

May, 2015

CurriculumNet: 大规模网络图像弱监督学习

该论文提出了一种基于课程学习的弱监督学习方法，通过对大规模网络图像数据进行无人工标注的深度神经网络训练，实现对大量噪声数据和数据分布不均等问题的有效处理和噪声标签的负面影响的显著降低，构建一种新的课程学习架构，使得使用高噪声标签的图像作为一种正则化策略可以惊人地提高模型的泛化能力，在 WebVision、ImageNet、Clothing-1M 和 Food-101 等四个基准测试中取得了最先进的性能，多模型集成的结果在 1000 种类别分类中取得了 5.2% 的 top-5 错误率，相对误差率超过 50%。

Aug, 2018

从网络数据中学习视觉 N-Grams

本文探讨利用网络数据进行图像识别系统的训练，采用了直观 n-grams 模型来预测图片内容相关短语，同时开发出适用于连接图像和标题、零样本传输等方面的模型。

Dec, 2016

基于网络监督的细粒度识别：基准数据集和方法

本文构建了两个新的基准网页监督的精细分类数据集 WebFG-496 和 WebiNat-5089，同时提出一种新的网页监督方法 Peer-learning，并在该数据集上进行了全面的实验。实验结果表明，该方法优于现有的基线模型和最先进的方法。

Aug, 2021

跨数据集分析测试平台

本文开展了针对视觉图像识别中数据集偏见问题的大规模分析，通过将 12 个已有数据库组织成一个语料库，提供了一个有用的特征储存库以供未来研究使用。

Feb, 2014

对含噪网络数据的类别级监督学习

本文提出了一种利用变分自编码器（VAE）和类别级别监督来处理网络数据的方法，并在三个基准数据集上进行了实验证明其有效性。

Mar, 2018

群体参与：一种弱监督深度学习框架用于从 Web 数据中学习

本文介绍了一种鲁棒性强的、端到端的深度弱监督学习框架，该框架通过随机分组和注意力机制来有效减少 Web 图片注释的负面影响，实现了对嘈杂标签的有效抑制和准确图像标注，实验证明了该方法的卓越性能。

Nov, 2016

基于数据驱动的元集合细粒度视觉分类

通过学习元数据集并应用数据驱动的元集合方法，我们可以解决使用网络图像进行细粒度图像识别时带有标签噪声的问题，并且相比于现有噪声鲁棒性方法，我们的方法要优越得多。

Aug, 2020