通过学习恢复原型来进行单张图像分类
本文提出了一种高效的基于图像补丁学习的框架,仅需一个图像输入输出对进行训练,实验证明该方法适用于监督式图像去模糊和超分辨率任务,并显著提高了学习模型的样本效率、泛化能力和时间复杂度。
Apr, 2024
本研究使用深度神经网络和度量学习的思想,建立了一种学习新概念的框架,从而不需要微调以适应新的类别类型,并在视觉和语言任务中定义了一次性学习问题,实验结果表明,在 Imagenet 数据集上,准确率从 87.6% 提高到 93.2%,在 Omniglot 数据集上,准确率从 88.0% 提高到 93.8%。
Jun, 2016
本文提出一种少样本学习方法,即使用原型网络从小样本中抽象出原型,将其映射到一个度量空间中,比较测试样本和原型之间的距离来进行分类,同时还将其拓展到零样本学习,取得了最先进的结果。
Mar, 2017
提出了一种新的神经网络结构,利用基于目标图像的条件来学习高质量的类别表示,采用动态学习方式进行类别之间的对比,对 Caltech-UCSD 鸟类细粒度分类任务取得了最先进的性能。
Feb, 2018
本研究关注于少样本目标检测的应用,旨在恢复少样本目标检测中缺失信息。通过引入新的正负样本代表和基于度量学习的框架,建立模型以提高状态最优的准确性。
Oct, 2020
本文介绍了一种新的针对单一类别训练原型 few-shot 模型的方法,引入了一个以零为中心的 “空类” 并通过批量标准化实现中心化,同时提出了一个用于距离计算的新的高斯层次,该层次考虑了支撑示例的分布而不仅是它们的质心,在 Omniglot 数据集上得到了.98 的分类准确率,在 MiniImageNet 数据集上的测试准确率为.8。
Jun, 2019
通过将输入样本分割成补丁,并借助 Vision Transformers 对其进行编码,从而在图像的局部区域之间建立语义对应关系,而不受其各自类别的影响。利用掩蔽图像建模等方法进行无监督训练,以克服标签不够精细以及避免负面的图像级注释影响,实现了对数据的更一般的统计结构的学习,并在四个流行的 Few-shot 分类基准测试中,对于 5-shot 和 1-shot 情形均取得了新的最优结果。
Jun, 2022
在有限的样本标注下,通过图像对目标对象进行少样本分类是一个任务。我们提出了一个一次性 / 少次分类模型,可以将任何未知类别的对象分类到一个相对通用的类别中,采用了基于层次对比损失的 ResNet152 分类器,基于图像嵌入所提取的特征对对象进行分类,而这些特征在训练阶段未被使用。我们在 ImageNet(ILSVRC-12)数据集的子集上进行了实验,该子集只包含用于训练我们的模型的动物类别,并创建了一组我们自己的未知类别数据集,用于评估我们训练得到的模型。我们的模型在将未知对象分类为通用类别方面得到了令人满意的结果,并对此进行了更详细的讨论。
Oct, 2023
本研究提出了一种基于度量学习的原型对齐网络(PANet)来解决仅使用少量样本进行图像分割的问题,它通过学习每个语义类别的原型表示,并通过匹配每个像素到所学习的原型来执行查询图像的分割,最终在 PASCAL-5i 上超越了现有技术达到了 48.1% 和 55.7% 的 mIoU 得分(1-shot 和 5-shot 设置),是一种有效的 few-shot segmentation 方法。
Aug, 2019
本文主要研究了基于简单特征变换的最近邻分类器在 few-shot 学习上的精度,并发现在 miniImageNet 数据集中,使用平均值减法和 L2 归一化的最近邻分类器在三个设置上优于之前的结果。
Nov, 2019