张量幻觉下的少样本学习
利用局部表示在改进新类别通用性方面发挥了作用,我们设计了一个新的预训练范式,通过软标签学习随机裁剪的补丁,并且我们提出了一种度量方法来处理由同质元素组成的集合,我们的方法在三个常用基准测试中取得了最新的最佳性能。
Jul, 2024
我们探索了视觉 - 语言模型中的多步推理问题,并提出了一种新的数据合成方法,通过使用先生成较简单的子任务,并依赖开源模型来完成这些子任务,从而构建了 50000 个视觉推理示例,并通过监督微调开发了一种视觉推理器,可以显著改善四个视觉问答基准上的四个视觉 - 语言模型的推理能力。
Jun, 2024
提出了一种新的无数据增量学习框架,通过学习类别的数据综合代替先前类别的数据存储,在引入新类别时更新网络;关键创新包括获取以往无法获取的类别的合成数据(称为 Continual Class-Specific Impression - CCSI)并有效利用这些数据来更新网络,同时采用多个损失函数来推广深度网络。
Jun, 2024
提出了一个新的数据集和基准 InteractADL,用于理解涉及人(和物体)之间互动的复杂 ADL,并提出了一种用于细粒度少样本视频分类的新方法 Name Tuning,该方法通过学习优化类别名称向量,使语义可分离,展示了在 InteractADL 和其他四个细粒度视觉分类基准上改进的性能。
Jun, 2024
我们研究了提示式学习模型在近似 OOD 检测中的能力,并观察到常用的 OOD 得分在此任务中表现有限。为了提升性能,我们提出了一种快速简单的后续方法,与现有的基于逻辑的得分相结合,将近似 OOD 检测的 AUROC 提高了最佳 11.67%,并具有最小的计算成本。我们的方法可以轻松应用于任何提示式学习模型,无需改变架构或重新训练模型。通过对 13 个数据集和 8 个模型进行全面的实证评估,证明了我们的方法的有效性和适应性。
May, 2024
基于 GPT-4 的数据合成能力,我们提出了一种通过训练小型语言模型来合成数学问题,以高效生成足够高质量的预训练数据的有效方法,并在数学推理数据集上展现了最先进的性能。
May, 2024
通过应用能量函数的理论概念和谱归一化方法,本研究提出了一种名为 SNoJoE 的能量函数,用于多标签异常检测任务,实验结果表明相对于先前方法,SNoJoE 在异常检测方面取得了显著改进,定义了该研究领域的新的最佳方法。
May, 2024
我们提出了一种有效的图像分类方法,通过从前景和背景元素中选择相关特征和使用预训练的 Vision Transformer (ViT) 对图像进行编码,然后通过筛选类相关的补丁嵌入来改善预训练模型的性能,并在流行的少样本分类基准测试中超过了现有的基线。
May, 2024
通过环境识别的鲁棒性少样本分类系统 EnvId,我们实现了对未知环境位置的取证调查,能够处理取证材料中的挑战性问题,包括信号降级、环境特征和录音位置不匹配等。
May, 2024
少样本分类中的异构问题(OOD)会导致模型性能下降,而交叉领域少样本分类(CD-FSC)和虚假相关少样本分类(SC-FSC)是 OOD 问题的主要组成部分。为了解决 SC-FSC 问题,我们提出了一个真实场景下收集的含有虚假相关偏移的基准测试 MetaCoCo,并使用 CLIP 作为预训练视觉语言模型来量化 MetaCoCo 的虚假相关偏移程度。实验结果表明,现有方法在存在虚假相关偏移的情况下性能显著下降。我们开源了基准测试的所有代码,希望 MetaCoCo 能促进未来在 SC-FSC 问题上的研究。
Apr, 2024