张量幻觉下的少样本学习

ICLRApr, 2021

Few-shot learning via tensor hallucination

Michalis Lazarou, Yannis Avrithis, Tania Stathaki

TL;DR本文提出了一种使用简单的损失函数训练特征生成器，在数据合成过程中生成张量特征而不是向量特征的方法，实验证明该方法在少样本分类中表现优异，超过了更复杂的数据增强方法，成为新的最先进技术。

Abstract

few-shot classification addresses the challenge of classifying examples given only limited labeled data. A powerful approach is to go beyond data augmentation, towards data synthesis. However, most of data augmen

few-shot classification data synthesis feature generator tensor features state of the art

发现论文，激发创造

发掘局部表征的威力用于少样本分类

利用局部表示在改进新类别通用性方面发挥了作用，我们设计了一个新的预训练范式，通过软标签学习随机裁剪的补丁，并且我们提出了一种度量方法来处理由同质元素组成的集合，我们的方法在三个常用基准测试中取得了最新的最佳性能。

Jul, 2024

从最少到最多：通过数据合成构建即插即用的视觉推理器

我们探索了视觉 - 语言模型中的多步推理问题，并提出了一种新的数据合成方法，通过使用先生成较简单的子任务，并依赖开源模型来完成这些子任务，从而构建了 50000 个视觉推理示例，并通过监督微调开发了一种视觉推理器，可以显著改善四个视觉问答基准上的四个视觉 - 语言模型的推理能力。

Jun, 2024

CCSI：连续类别特定印象的无数据类别递增学习

提出了一种新的无数据增量学习框架，通过学习类别的数据综合代替先前类别的数据存储，在引入新类别时更新网络；关键创新包括获取以往无法获取的类别的合成数据（称为 Continual Class-Specific Impression - CCSI）并有效利用这些数据来更新网络，同时采用多个损失函数来推广深度网络。

Jun, 2024

日常生活互动活动的少样本分类（InteractADL）

提出了一个新的数据集和基准 InteractADL，用于理解涉及人（和物体）之间互动的复杂 ADL，并提出了一种用于细粒度少样本视频分类的新方法 Name Tuning，该方法通过学习优化类别名称向量，使语义可分离，展示了在 InteractADL 和其他四个细粒度视觉分类基准上改进的性能。

Jun, 2024

提升预测学习中的近似 OOD 检测：最大利益，最小成本

我们研究了提示式学习模型在近似 OOD 检测中的能力，并观察到常用的 OOD 得分在此任务中表现有限。为了提升性能，我们提出了一种快速简单的后续方法，与现有的基于逻辑的得分相结合，将近似 OOD 检测的 AUROC 提高了最佳 11.67％，并具有最小的计算成本。我们的方法可以轻松应用于任何提示式学习模型，无需改变架构或重新训练模型。通过对 13 个数据集和 8 个模型进行全面的实证评估，证明了我们的方法的有效性和适应性。

May, 2024

JiuZhang3.0：通过训练小型数据合成模型高效提升数学推理能力

基于 GPT-4 的数据合成能力，我们提出了一种通过训练小型语言模型来合成数学问题，以高效生成足够高质量的预训练数据的有效方法，并在数学推理数据集上展现了最先进的性能。

May, 2024

具备光谱归一化联合能量的多标签离群检测

通过应用能量函数的理论概念和谱归一化方法，本研究提出了一种名为 SNoJoE 的能量函数，用于多标签异常检测任务，实验结果表明相对于先前方法，SNoJoE 在异常检测方面取得了显著改进，定义了该研究领域的新的最佳方法。

May, 2024

少样本图像分类的类相关补丁嵌入选择

我们提出了一种有效的图像分类方法，通过从前景和背景元素中选择相关特征和使用预训练的 Vision Transformer (ViT) 对图像进行编码，然后通过筛选类相关的补丁嵌入来改善预训练模型的性能，并在流行的少样本分类基准测试中超过了现有的基线。

May, 2024

法庭场景中我们能否识别未知音频录制环境？

通过环境识别的鲁棒性少样本分类系统 EnvId，我们实现了对未知环境位置的取证调查，能够处理取证材料中的挑战性问题，包括信号降级、环境特征和录音位置不匹配等。

May, 2024

MetaCoCo: 一个新的具有虚假关联的少样本分类基准

少样本分类中的异构问题（OOD）会导致模型性能下降，而交叉领域少样本分类（CD-FSC）和虚假相关少样本分类（SC-FSC）是 OOD 问题的主要组成部分。为了解决 SC-FSC 问题，我们提出了一个真实场景下收集的含有虚假相关偏移的基准测试 MetaCoCo，并使用 CLIP 作为预训练视觉语言模型来量化 MetaCoCo 的虚假相关偏移程度。实验结果表明，现有方法在存在虚假相关偏移的情况下性能显著下降。我们开源了基准测试的所有代码，希望 MetaCoCo 能促进未来在 SC-FSC 问题上的研究。

Apr, 2024