揭示组成式零样本学习中的近邻长尾分布
本文提出了一种使用 CLIP 模型的语言信息分布 ——PLID 模型来增强光学识别任务中未知组合视觉概念的泛化性能,通过软提示类嵌入式的组合和原始的嵌入式混合策略来融合一致的分类决策。使用 MIT-States、UT-Zappos、C-GQA 数据集的实验结果表明,PLID 方法相较于其他方法表现更佳。
May, 2023
通过使用 Composition Transformer(CoT)框架,我们提出了一种简单可扩展的方法来解决组合式零样本学习(CZSL)中的上下文问题、视觉特征可辨识性问题和真实世界组合数据的长尾分布问题;CoT 框架通过底层的自下而上方式提取代表性的物体嵌入,并通过顶层的自上而下方式以一种显式建模上下文性的对象引导注意力模块生成代表性的属性嵌入;我们还开发了一种简单的少数类属性增广(MAA)方法,通过混合两张图像和过采样少数类属性来合成虚拟样本,以解决不平衡的数据分布所引起的预测偏差;我们的方法在多个基准测试集上达到了最先进的性能,包括 MIT-States,C-GQA 和 VAW-CZSL;此外,我们还展示了 CoT 在提高视觉辨识能力和解决因不平衡数据分布而引起的模型偏差方面的有效性。
Aug, 2023
本文提出了一种新的模型用于 compositional zero-shot learning,该模型通过评估组合成分的可行性分数,采用余弦相似度来估计视觉特征和组成嵌入之间的相似度,从而实现解决开放世界中的 compositional zero-shot learning 问题的目标。在实验中,该方法表现出了显着的优越性能。
Jan, 2021
本文提出了一种基于图卷积神经网络的组合余弦图嵌入方法,通过估计每种未知组合的可行性得分,进而提高其在余弦相似度损失函数中的权重,并在开放世界场景中实现了最先进的表现。
May, 2021
该论文提出了一种使用交叉注意力作为组合分离器来学习分离概念嵌入的方法,使用地球移动距离作为跨注意力模块中的特征相似度度量,在多个概念概率的基础上提高推理结果,并在三个 CZSL 基准数据集上进行的综合实验表明,该方法在闭合和开放世界设置下都显著优于以前的方法,建立了一个新的最先进技术。
Mar, 2023
描述了一种利用因果思想构建复合泛化的方式,并建议将零样本推理视为查找 “哪种干预导致了图像?”; 提出了一种因果启发的嵌入模型,该模型从相关(混淆)训练数据中学习可视对象的基本部分的分解表示,用于预测属性 - 对象对的新组合。 在两个数据集上进行评估,结果比强基准方法有所改善。
Jun, 2020
为了更准确地预测未见过的属性 - 物体对并改善在开放世界中的组合过滤,在通常被忽略的特异性水平上考虑属性的多样性和上下文,我们引入了基于上下文和多样性的特异性学习框架用于组合零样本学习 (CDS-CZSL)。在闭世界和开放世界的情景中进行了实验,我们的模型在三个数据集上实现了最先进的结果。
Feb, 2024