无监督学习视觉嵌入的本地聚合
本文介绍了一种使用大量未标记数据进行无监督学习的方法,通过使用数十万个未标记的web视频作为数据集,设计了一个具有排名损失函数的Siamese-Triplet网络,用于深度卷积神经网络的无监督学习,可在不使用ImageNet的情况下,获得52%的mAP的性能,并展示了此非监督网络在其它任务中表现出竞争性。
May, 2015
在本论文中,我们提出了一种循环框架用于深度表示和图像聚类的联合无监督学习(JULE)。通过在卷积神经网络(CNN)输出的表示层上堆叠聚类算法的连续操作的循环过程,在前向传递中进行图像聚类,在后向传递中进行表示学习。我们的主要想法是将两个过程集成到一个模型中,该模型具有统一加权的三元组损失函数,并进行端到端的优化,从而获得更强大的表示和更精确的图像聚类。在广泛的实验中,该方法在各种图像数据集的图像聚类中表现优于现有技术,并且学习到的表示在转移到其他任务时具有很好的通用性。
Apr, 2016
本研究致力于解决视觉数据无监督学习中的目标检测问题,使用包含深度神经网络的学生路径来训练模型,该模型可以在测试时明显优于无监督视频发现教师,并在 YouTube 视频数据集和目标发现数据集等基准测试中取得了最先进的结果,测试时比其他方法至少快两个数量级。
Mar, 2017
本研究提出利用2D旋转来训练卷积神经网络学习图像特征的无监督语义特征学习方法,并在演示和各种无监督特征学习基准测试中详尽评估该方法,在所有测试中均表现出明显的优异性能。
Mar, 2018
本文介绍了Video Instance Embedding(VIE)框架,它扩展了用于学习深度非线性嵌入的强大无监督损失函数以进行大规模视频数据集上的多流时间处理架构,展示了VIE训练的网络在Kinetics数据集的动作识别和ImageNet数据集的目标识别中有重大发展,并提供了分析表明路径如何有所不同。
May, 2019
本研究提出了一种无监督图像分类框架, 旨在通过不使用嵌入聚类来简化和优化深度聚类算法, 并在ImageNet数据集上进行了实验。同时验证了其在多标签图像分类,目标检测,语义分割等任务的泛化性,以及其在迁移学习中的有效性。
Jun, 2020
该研究提出了一种简单的无监督视觉表示学习方法,使用参数化的实例级分类器来区分数据集中的所有图像作为前提任务。这种方法解决了大规模训练的困难,并提供了一种相似度先验,以在多个视觉任务中实现了竞争性的性能表现。
Feb, 2021
本文提供一个综合性的比较不同无监督学习方法在图像特征表达方面的表现,使用线性评估、最近邻分类和聚类等多个基准测试来定量比较,分析了不同嵌入度量的均匀性、容忍性和中心内核对齐,并提出了两个新的度量。通过比较分析发现不能以单一流行的方法来代表整个领域的研究,在未来的工作中,应考虑如何利用这些方法的互补性。同时提供了一个统一的框架来定量数据增强不变性,并提醒不同任务需要的增强不变性类型各有差异。
Jun, 2022
通过无监督的深度度量学习方法,本文提出了一种新颖的混合比例分组的无监督协同度量学习方法(MS-UGCML),用于学习不同尺度对象的嵌入表示。同时,通过利用COCO 2017和VOC 2007数据集,组装了一套挑战集,以促进通用对象检索模型的训练和评估。综合评估表明,我们的无监督MS-UGCML方法在对象级别和图像级别的mAP提升了6.69%和10.03%。
Mar, 2024